IBM y el Centro Marshall de Vuelos Espaciales de la NASA anunciaron una colaboración para utilizar la tecnología de inteligencia artificial (IA) de IBM con el fin de descubrir nuevas perspectivas en el enorme caudal de datos científicos terrestres y geoespaciales de la NASA. El trabajo conjunto aplicará por primera vez la tecnología de modelos de fundamentos de IA a los datos de los satélites de observación de la Tierra de la NASA. Los modelos de fundamentación son tipos de modelos de IA que se entrenan con un amplio conjunto de datos sin etiquetar, pueden utilizarse para diferentes tareas y pueden aplicar la información de una situación a otra.

Estos modelos han hecho avanzar rápidamente el campo de la tecnología de procesamiento del lenguaje natural (PLN) en los últimos cinco años, e IBM es pionera en las aplicaciones de los modelos fundacionales más allá del lenguaje. Las observaciones de la Tierra que permiten a los científicos estudiar y vigilar nuestro planeta se están recopilando a un ritmo y con un volumen sin precedentes. Se necesitan enfoques nuevos e innovadores para extraer conocimientos de estos vastos recursos de datos.

El objetivo de este trabajo es proporcionar a los investigadores una forma más sencilla de analizar y extraer conocimientos de estos grandes conjuntos de datos. La tecnología de modelos de cimentación de IBM tiene el potencial de acelerar el descubrimiento y el análisis de estos datos para avanzar rápidamente en la comprensión científica de la Tierra y la respuesta a los problemas relacionados con el clima. IBM y la NASA tienen previsto desarrollar varias tecnologías nuevas para extraer información de las observaciones de la Tierra.

Un proyecto entrenará un modelo de base de inteligencia geoespacial de IBM en el conjunto de datosHarmonized Landsat Sentinel-2 (HLS) de la NASA, un registro de los cambios en la cubierta y el uso del suelo captados por los satélites en órbita terrestre. Mediante el análisis de petabytes de datos satelitales para identificar los cambios en la huella geográfica de fenómenos como las catástrofes naturales, los rendimientos cíclicos de los cultivos y los hábitats de la vida salvaje, esta tecnología de modelos de cimentación ayudará a los investigadores a proporcionar un análisis crítico de los sistemas medioambientales de nuestro planeta. Se espera que otro resultado de esta colaboración sea un corpus de literatura sobre las ciencias de la Tierra en el que se puedan realizar búsquedas fácilmente. IBM ha desarrollado un modelo NLP entrenado en casi 300.000 artículos de revistas de ciencias de la Tierra para organizar la literatura y facilitar el descubrimiento de nuevos conocimientos.

El modelo, que contiene una de las mayores cargas de trabajo de IA entrenadas en el software OpenShift de Red Hat hasta la fecha, utiliza PrimeQA, el sistema multilingüe de respuesta a preguntas de código abierto de IBM. Además de proporcionar un recurso a los investigadores, el nuevo modelo lingüístico para las ciencias de la Tierra podría infundirse en los procesos de gestión y administración de datos científicos de la NASA. Otros posibles proyectos conjuntos IBM-NASA en el marco de este acuerdo incluyen la construcción de un modelo base para la predicción meteorológica y climática utilizando MERRA-2, un conjunto de datos de observaciones atmosféricas.

Esta colaboración forma parte de la Iniciativa Científica de Código Abierto de la NASA, un compromiso para construir una comunidad científica abierta inclusiva, transparente y colaborativa durante la próxima década.