Cloudera ha anunciado soporte adicional para tecnologías clave de NVIDIA en nubes públicas y privadas con el fin de ayudar a los clientes a crear e implantar de forma eficiente las mejores aplicaciones de inteligencia artificial. Esta nueva fase en la colaboración tecnológica de Cloudera con NVIDIA añade capacidades de GPU multigeneracionales para ingeniería de datos, aprendizaje automático e inteligencia artificial tanto en nubes públicas como privadas:Aceleración de las cargas de trabajo de IA y aprendizaje automático en Cloudera en la nube pública y en las instalaciones utilizando las GPU NVIDIA Cloudera Machine Learning [2] (CML) es un servicio líder de Cloudera Data Platform que permite a las empresas crear sus propias aplicaciones de IA, liberando el potencial de los Large Language Models (LLM) de código abierto mediante la utilización de sus propios activos de datos para crear respuestas seguras y contextualmente precisas. El servicio CML es ahora compatible con la GPU de última generación NVIDIA H100 en nubes públicas y en centros de datos.

Esta aceleración de última generación potencia la plataforma de datos de Cloudera, lo que permite obtener conocimientos más rápidos y cargas de trabajo de IA generativa más eficientes. Esto se traduce en la capacidad de afinar los modelos en conjuntos de datos de mayor tamaño y de alojar modelos más grandes en producción. La seguridad y gobernanza de nivel empresarial de CML significa que las empresas pueden aprovechar la potencia de las GPU NVIDIA sin comprometer la seguridad de los datos.

Cloudera Data Engineering [3] (CDE) es un servicio de datos que permite a los usuarios construir pipelines de datos fiables y listos para producción a partir de sensores, redes sociales, marketing, pagos, RRHH, ERP, CRM u otros sistemas en el lago de datos abierto con seguridad y gobernanza integradas, orquestado con Apache Airflow, un proyecto de código abierto para construir pipelines en aprendizaje automático. Con la integración de NVIDIA Spark RAPIDS en CDE, ahora es posible acelerar las cargas de trabajo de extracción, transformación y carga (ETL) sin necesidad de refactorización. Las aplicaciones ETL Spark existentes pueden acelerarse sin problemas en la GPU por un factor de 7 veces en general y hasta 16 veces en determinadas consultas [4] en comparación con las CPU estándar (según pruebas de rendimiento internas).

Esto permite a los clientes de NVIDIA aprovechar las GPU en los pipelines de procesamiento de datos ascendentes, lo que aumenta la utilización de estas GPU y demuestra un mayor retorno de la inversión.