Oracle ha anunciado la disponibilidad general de HeatWave GenAI, que incluye los primeros modelos de lenguaje de gran tamaño (LLM) en base de datos del sector, un almacén vectorial automatizado en base de datos, procesamiento vectorial escalable y la capacidad de mantener conversaciones contextuales en lenguaje natural basadas en contenidos no estructurados. Estas nuevas capacidades permiten a los clientes llevar el poder de la IA generativa a los datos de su empresa, sin necesidad de conocimientos de IA ni de trasladar los datos a una base de datos vectorial independiente. HeatWave GenAI está disponible inmediatamente en todas las regiones de Oracle Cloud, en la región dedicada de Oracle Cloud Infrastructure (OCI) y en todas las nubes sin coste adicional para los clientes de HeatWave.

Con HeatWave GenAI, los desarrolladores pueden crear un almacén vectorial para contenidos empresariales no estructurados con un solo comando SQL, utilizando modelos de incrustación incorporados. Los usuarios pueden realizar búsquedas en lenguaje natural en un solo paso utilizando LLM internos de la base de datos o externos. Los datos no salen de la base de datos y, gracias a la escala y el rendimiento extremos de HeatWave, no es necesario aprovisionar GPU. Como resultado, los desarrolladores pueden reducir la complejidad de las aplicaciones, aumentar el rendimiento, mejorar la seguridad de los datos y reducir los costes.

Entre las nuevas funciones automatizadas e integradas de IA generativa se incluyen: Los LLM integrados en la base de datos simplifican el desarrollo de aplicaciones de IA generativa a un coste menor. Los clientes pueden beneficiarse de la IA generativa sin la complejidad de la selección e integración de LLM externos, y sin preocuparse por la disponibilidad de los LLM en los centros de datos de los distintos proveedores de la nube. Los LLM en la base de datos permiten a los clientes buscar datos, generar o resumir contenidos y realizar la generación aumentada por recuperación (RAG) con HeatWave Vector Store.

Además, pueden combinar la IA generativa con otras capacidades integradas de HeatWave, como AutoML, para crear aplicaciones más ricas. HeatWave GenAI también está integrado con el servicio OCI Generative AI para acceder a modelos fundacionales preentrenados de los principales proveedores de LLM. El almacén de vectores automatizado en la base de datos permite a los clientes utilizar la IA generativa con sus documentos empresariales sin necesidad de trasladar los datos a una base de datos de vectores independiente y sin conocimientos de IA.

Todos los pasos para crear un almacén vectorial e incrustaciones vectoriales están automatizados y se ejecutan dentro de la base de datos, incluido el descubrimiento de los documentos en el almacenamiento de objetos, su análisis sintáctico, la generación de incrustaciones de forma altamente paralela y optimizada, y su inserción en el almacén vectorial, lo que hace que HeatWave Vector Store sea eficiente y fácil de usar. El uso de un almacén de vectores para RAG ayuda a resolver el reto de la alucinación de los LLM, ya que los modelos pueden buscar datos propios con el contexto adecuado para proporcionar respuestas más precisas y relevantes. El procesamiento vectorial a escala proporciona resultados de búsqueda semántica muy rápidos sin pérdida de precisión.

HeatWave admite un nuevo tipo de datos VECTOR nativo y una implementación optimizada de la función de distancia, lo que permite a los clientes realizar consultas semánticas con SQL estándar. La representación columnar híbrida en memoria y la arquitectura scale-out de HeatWave permiten que el procesamiento vectorial se ejecute con un ancho de banda cercano a la memoria y se paralelice en hasta 512 nodos HeatWave. Como resultado, los clientes obtienen respuesta a sus preguntas rápidamente.

Los usuarios también pueden combinar la búsqueda semántica con otros operadores SQL para, por ejemplo, unir varias tablas con documentos diferentes y realizar búsquedas por similitud en todos los documentos. HeatWave Chat es un complemento de Visual Code para MySQL Shell que proporciona una interfaz gráfica para HeatWave GenAI y permite a los desarrolladores formular preguntas en lenguaje natural o SQL. El navegador integrado Lakehouse Navigator permite a los usuarios seleccionar archivos del almacenamiento de objetos y crear un almacén de vectores.

Los usuarios pueden buscar en toda la base de datos o restringir la búsqueda a una carpeta. HeatWave mantiene el contexto con el historial de las preguntas formuladas, las citas de los documentos fuente y la indicación al LLM. Esto facilita una conversación contextual y permite a los usuarios verificar la fuente de las respuestas generadas por el LLM.

Este contexto se mantiene en HeatWave y está disponible para cualquier aplicación que utilice HeatWave.