AMD mostró sus últimas capacidades de computación y software de extremo a extremo para los clientes y desarrolladores de Microsoft. Mediante el uso de soluciones de AMD como los aceleradores AMD Instinct MI300X, el software abierto ROCm, los procesadores y software Ryzen AI y los aceleradores de medios Alveo MA35D, Microsoft es capaz de proporcionar un potente conjunto de herramientas para despliegues basados en AI en numerosos mercados. Las nuevas máquinas virtuales (VM) Microsoft Azure ND MI300X ya están disponibles de forma general, ofreciendo a clientes como Hugging Face, acceso a un rendimiento y una eficiencia impresionantes para sus cargas de trabajo de IA más exigentes.

Anunciada previamente en primicia en noviembre de 2023, la serie de máquinas virtuales Azure ND MI300x v5 ya está disponible en la región de Canadá Central para que los clientes ejecuten sus cargas de trabajo de IA. Estas VM, que ofrecen un rendimiento líder en el sector, proporcionan una capacidad HBM y un ancho de banda de memoria impresionantes, lo que permite a los clientes incluir modelos más grandes en la memoria de la GPU y/o utilizar menos GPU, lo que, en última instancia, ayuda a ahorrar energía, costes y tiempo de solución. Estas máquinas virtuales y el software ROCm que las alimenta también se están utilizando para cargas de trabajo de producción de IA Azure, incluido el servicio Azure OpenAI, proporcionando a los clientes acceso a modelos GPT-3.5 y GPT-4.

Con AMD Instinct MI300X y la pila de software abierto ROCm probada y preparada, Microsoft puede conseguir una relación precio/rendimiento líder en cargas de trabajo de inferencia GPT. Más allá de las cargas de trabajo de producción de Azure AI, uno de los primeros clientes en utilizar estas máquinas virtuales es Hugging Face. Al portar sus modelos a las máquinas virtuales ND MI300X en sólo un mes, Hugging Face fue capaz de lograr un rendimiento y una relación precio/rendimiento impresionantes para sus modelos.

Como parte de esto, los clientes de ND MI300X VM pueden llevar los modelos de Hugging Face a las VM para crear e implantar aplicaciones de PNL con facilidad y eficacia. Además, los desarrolladores pueden utilizar el software AMD Ryzen AI para optimizar y desplegar la inferencia de IA en los PC con tecnología AMD Ryzen AI. El software Ryzen AI permite que las aplicaciones se ejecuten en la unidad de procesamiento neuronal (NPU) construida sobre la arquitectura AMD XDNA, el primer silicio de procesamiento de IA dedicado en un procesador Windows x862. Mientras que ejecutar modelos de IA únicamente en una CPU o una GPU puede agotar la batería rápidamente, con un portátil Ryzen AI powered, los modelos de IA funcionan en la NPU integrada, liberando recursos de la CPU y la GPU para otras tareas de cálculo.

Esto ayuda a aumentar significativamente la duración de la batería y permite a los desarrolladores ejecutar cargas de trabajo de IA LLM en el dispositivo y aplicaciones concurrentes de forma eficiente y local. Microsoft ha seleccionado el acelerador multimedia AMD Alveo MA35D para alimentar sus ingentes cargas de trabajo de transmisión de vídeo en directo, incluidos Microsoft Teams, vídeo de SharePoint y otros. Diseñado específicamente para alimentar servicios de streaming interactivo en directo a escala, el Alveo MA35D ayudará a Microsoft a garantizar una experiencia de vídeo de alta calidad agilizando las cargas de trabajo de procesamiento de vídeo, incluyendo la transcodificación, decodificación, codificación y streaming con tasa de bits adaptativa (ABR).

Utilizando el acelerador Alveo MA35D en servidores equipados con procesadores AMD EPYC de 4ª generación, Microsoft está consiguiendo: Capacidad para consolidar servidores e infraestructuras en la nube - aprovechando la alta densidad de canales, la eficiencia energética y las capacidades de procesamiento de vídeo de latencia ultrabaja del Alveo MA35D, Microsoft puede reducir significativamente el número de servidores necesarios para soportar sus aplicaciones de streaming interactivo en directo de gran volumen. Rendimiento impresionante: el Alveo MA35D incorpora unidades de procesamiento de vídeo basadas en ASIC compatibles con el estándar de compresión AV1 y optimizaciones de calidad de vídeo habilitadas por IA que ayudan a garantizar experiencias de vídeo fluidas y sin interrupciones. Tecnología AV1 preparada para el futuro - con una ruta de actualización para soportar estándares emergentes como AV1, el Alveo MA35D proporciona a Microsoft una solución que puede adaptarse a la evolución de los requisitos de procesamiento de vídeo.

Los procesadores AMD EPYC de 4ª generación alimentan numerosas máquinas virtuales de computación de propósito general, intensivas en memoria, optimizadas para computación y aceleradas en Azure. Estas máquinas virtuales muestran el crecimiento y la demanda de los procesadores AMD EPYC en la nube y pueden proporcionar hasta un 20% más de rendimiento para máquinas virtuales de propósito general y de uso intensivo de memoria con una mejor relación precio/rendimiento, y hasta el doble de rendimiento de la CPU para máquinas virtuales de cálculo optimizado frente a la generación anterior de máquinas virtuales impulsadas por procesadores AMD EPYC en Azure. Ahora en vista previa, las series de máquinas virtuales Dalsv6, Dasv6, Easv6, Falsv6 y Famsv6 estarán disponibles de forma general en los próximos meses.