Fujitsu Limited y la Universidad Carnegie Mellon anunciaron el desarrollo de una nueva tecnología para visualizar situaciones de tráfico, incluyendo personas y vehículos, como parte de una investigación conjunta sobre Social Digital Twin que comenzó en 2022. La tecnología transforma una imagen de escena 2D captada por una cámara monocular RGB en un formato 3D digitalizado utilizando IA, que estima la forma y posición 3D de personas y objetos permitiendo una visualización de alta precisión de escenas 3D dinámicas. A partir del 22 de febrero de 2024, Fujitsu y la Universidad Carnegie Mellon realizarán pruebas de campo aprovechando los datos de las intersecciones de Pittsburgh (EE.UU.) para verificar las aplicaciones de esta tecnología.

Esta tecnología se basa en una IA que ha sido entrenada para detectar la forma de las personas y los objetos mediante el aprendizaje profundo. Este sistema se compone de dos tecnologías básicas La tecnología de estimación de la ocupación 3D, que estima la ocupación 3D de cada objeto sólo a partir de una cámara monocular RGB, y la tecnología de proyección 3D, que localiza con precisión cada objeto dentro de modelos de escenas 3D. Utilizando estas tecnologías, las imágenes tomadas en situaciones en las que las personas y los coches están densamente situados, como en las intersecciones, pueden reconstruirse dinámicamente en un espacio virtual 3D, proporcionando así una herramienta crucial para el análisis avanzado del tráfico y la prevención potencial de incidentes que no podrían ser captados por las cámaras de vigilancia.

Los rostros y las matrículas se anonimizan para ayudar a preservar la privacidad. De cara al futuro, Fujitsu y la Universidad Carnegie Mellon pretenden comercializar esta tecnología para el año fiscal 2025 comprobando su utilidad no sólo en el transporte sino también en las ciudades inteligentes y la seguridad del tráfico, con el objetivo de ampliar su ámbito de aplicación. En febrero de 2022, Fujitsu y laSchool of Computer Science y la College of Engineering de la Universidad Carnegie Mellon iniciaron su investigación conjunta sobre la tecnología Social Digital Twin, que reproduce dinámicamente en 3D complejas interacciones entre personas, bienes, economías y sociedades.

Estas tecnologías permiten construir objetos en 3D con gran precisión a partir de múltiples fotografías tomadas de vídeos grabados desde distintos ángulos. Sin embargo, a medida que avanzaba la investigación conjunta, se descubrió que los métodos de análisis de vídeo existentes eran técnicamente insuficientes para reconstruir dinámicamente en 3D las imágenes captadas. Se necesitaban múltiples cámaras para reproducirlo, y había problemas de privacidad, carga de trabajo y coste, que se convirtieron en un obstáculo para su aplicación social.