Renesas Electronics Corporation ha anunciado el desarrollo de una tecnología de procesador integrado que permite mayores velocidades y un menor consumo de energía en las unidades de microprocesador (MPU) que realizan la IA de visión avanzada. Las nuevas tecnologías desarrolladas son las siguientes (1) Un acelerador de IA basado en un procesador reconfigurable dinámicamente (DRP) que procesa eficazmente modelos de IA ligeros y (2) una tecnología de arquitectura heterogénea que permite el procesamiento en tiempo real mediante el funcionamiento cooperativo de las IP del procesador, como la CPU. Renesas fabricó un prototipo de una AI-MPU embebida con estas tecnologías y confirmó su funcionamiento a alta velocidad y bajo consumo.

Consiguió un procesamiento hasta 16 veces más rápido (130 TOPS) que antes de la introducción de estas nuevas tecnologías, y una eficiencia energética de primer orden (hasta 23,9 TOPS/W con una alimentación de 0,8 V). En medio de la reciente expansión de los robots en fábricas, logística, servicios médicos y tiendas, existe una creciente necesidad de sistemas que puedan funcionar de forma autónoma en tiempo real detectando el entorno mediante IA de visión avanzada. Dado que existen severas restricciones en cuanto a la generación de calor, especialmente en los dispositivos integrados, se requiere tanto un mayor rendimiento como un menor consumo de energía en los chips de IA.

Renesas desarrolló nuevas tecnologías para cumplir estos requisitos y presentó estos logros el 21 de febrero, en la Conferencia Internacional de Circuitos de Estado Sólido 2024 (ISSCC 2024), celebrada entre el 18 y el 22 de febrero de 2024 en San Francisco. Las tecnologías desarrolladas por Renesas son las siguientes: (1) Un acelerador de IA que procesa eficientemente modelos de IA ligeros- Como tecnología típica para mejorar la eficiencia del procesamiento de la IA, existe la poda para omitir cálculos que no afectan significativamente a la precisión del reconocimiento. Sin embargo, es habitual que los cálculos que no afectan a la precisión del reconocimiento existan aleatoriamente en los modelos de IA.

Esto provoca una diferencia entre el paralelismo del procesamiento por hardware y la aleatoriedad de la poda, lo que hace que el procesamiento sea ineficiente. Para resolver este problema, Renesas optimizó su exclusivo acelerador de IA basado en DRP (DRP-AI) para la poda. Analizando cómo las características de los patrones de poda y un método de poda están relacionados con la precisión del reconocimiento en los modelos típicos de IA de reconocimiento de imágenes (modelos CNN), se identificó la estructura de hardware de un acelerador de IA que puede lograr tanto una alta precisión de reconocimiento como una tasa de poda eficiente, y se aplicó al diseño del DRP-AI.

Además, se desarrolló un software para reducir el peso de los modelos de IA optimizados para esta DRP-AI. Este software convierte la configuración del modelo de poda aleatoria en una computación paralela altamente eficiente, lo que da como resultado un procesamiento de IA de mayor velocidad. En concreto, la tecnología de apoyo a la poda altamente flexible de Renesas (tecnología de poda N:M flexible), que puede cambiar dinámicamente el número de ciclos en respuesta a los cambios en la tasa de poda local de los modelos de IA, permite un control preciso de la tasa de poda en función del consumo de energía, la velocidad de funcionamiento y la precisión de reconocimiento requeridos por los usuarios.

Esta tecnología reduce el número de ciclos de procesamiento de modelos de IA a tan sólo una dieciseisava parte de la poda de modelos incompatibles y consume menos de una octava parte de la energía. (2) Tecnología de arquitectura heterogénea que permite el procesamiento en tiempo real para el control de robots- Las aplicaciones robóticas requieren un procesamiento avanzado de IA de visión para el reconocimiento del entorno circundante. Mientras tanto, el juicio y el control del movimiento del robot requieren una programación detallada de las condiciones en respuesta a los cambios en el entorno circundante, por lo que el procesamiento de software basado en la CPU es más adecuado que el procesamiento basado en la IA.

El reto ha sido que las CPU con procesadores integrados actuales no son totalmente capaces de controlar robots en tiempo real. Por ello, Renesas introdujo un procesador reconfigurable dinámicamente (DRP), que se encarga del procesamiento complejo, además de la CPU y el acelerador de IA (DRP-AI). Esto condujo al desarrollo de la tecnología de arquitectura heterogénea que permite mayores velocidades y un menor consumo de energía en las AI-MPU al distribuir y paralelizar los procesos adecuadamente.

Un DRP ejecuta una aplicación mientras cambia dinámicamente la configuración de conexión de circuitos entre las unidades aritméticas del interior del chip para cada reloj de operación en función de los detalles del procesamiento. Dado que sólo funcionan los circuitos aritméticos necesarios, incluso para un procesamiento complejo, es posible reducir el consumo de energía y aumentar la velocidad. Por ejemplo, SLAM (localización y mapeo simultáneos), una de las aplicaciones típicas de los robots, es una configuración compleja que requiere múltiples procesos de programación para el reconocimiento de la posición del robot en paralelo con el reconocimiento del entorno mediante el procesamiento de IA de visión.

Renesas demostró el funcionamiento de este SLAM mediante la conmutación instantánea de programas con el DRP y el funcionamiento en paralelo del acelerador de IA y la CPU, lo que se traduce en una velocidad de funcionamiento unas 17 veces mayor y una eficiencia energética de funcionamiento unas 12 veces superior a la de la CPU integrada por sí sola. Verificación del funcionamiento- Renesas creó un prototipo de un chip de prueba con estas tecnologías y confirmó que alcanzaba el nivel mundial, una eficiencia energética de 23,9 TOPS por vatio a una tensión de alimentación normal de 0,8 V para el acelerador de IA y una eficiencia energética de funcionamiento de 10 TOPS por vatio para los principales modelos de IA. También demostró que el procesamiento de la IA es posible sin ventilador ni disipador de calor.

La utilización de estos resultados ayuda a resolver la generación de calor debida al aumento del consumo de energía, que ha sido uno de los retos asociados a la implementación de chips de IA en diversos dispositivos integrados, como robots de servicio y vehículos de guiado automático. La reducción significativa de la generación de calor contribuirá a la expansión de la automatización en diversas industrias, como los mercados de la robótica y la tecnología inteligente. Estas tecnologías se aplicarán a las Renesas?

MPU de la serie RZ/V para aplicaciones de IA de visión.