WiMi Hologram Cloud Inc. ha anunciado que ha integrado la información semántica y la tecnología lidar en el algoritmo SLAM para explorar el algoritmo SLAM de segmentación semántica basado en lidar en entornos dinámicos. Al realizar la segmentación semántica, se pueden visualizar los posibles objetos móviles del entorno, lo que ayuda al algoritmo SLAM a filtrar los objetos móviles en el módulo de seguimiento y mapeo de características, obteniendo así resultados más precisos en la estimación de la pose. La información semántica se considera importante para que los robots pasen de la percepción a la inteligencia cognitiva.

El SLAM semántico es un enfoque importante para integrar la información semántica en la representación del entorno. El algoritmo SLAM de segmentación semántica basado en lidar utiliza primero redes de atención espacial para la segmentación semántica de nubes de puntos. La red neuronal convolucional completa puede realizar una extracción de características y una clasificación eficaces de los datos de la nube de puntos, lo que permite segmentar los distintos objetos y fondos del entorno.

Mediante la segmentación semántica, puede obtener información sobre los objetos en movimiento, lo que ayuda a filtrarlos en el posterior proceso de seguimiento de características y construcción de mapas, mejorando así la precisión de la estimación de la pose. Además, para manejar mejor el problema SLAM en entornos dinámicos, se introduce el conocimiento a priori para guiar los criterios de categorización de los elementos del entorno. Al utilizar plenamente el conocimiento del entorno existente, se puede determinar con mayor precisión qué elementos del entorno son estáticos y cuáles dinámicos.

Esta introducción del conocimiento a priori puede mejorar eficazmente la precisión de la identificación y el seguimiento de los elementos dinámicos. Una vez identificados los elementos dinámicos, se pueden seguir realizando la estimación de la postura y la construcción del grafo semántico. La estimación de la postura se refiere a la especulación de la posición y la orientación del robot en el entorno mediante el análisis de los datos de los sensores.

La construcción de mapas semánticos, por su parte, utiliza los modelos conocidos del entorno y los resultados de la segmentación semántica para generar mapas que contengan información semántica. La realización de estos pasos puede proporcionar un soporte de información preciso para que los robots inteligentes naveguen y tomen decisiones en entornos dinámicos. Los módulos tecnológicos clave del algoritmo SLAM basado en lidar y restricciones semánticas propuesto por WiMi incluyen varios aspectos como el procesamiento de datos lidar, la segmentación semántica, la separación de objetos en movimiento y estáticos, la estimación de la actitud y la construcción de mapas, que cooperan para resolver conjuntamente los retos del SLAM en entornos dinámicos y mejorar la precisión y fiabilidad de la percepción del entorno y la autolocalización.

Procesamiento de datos Lidar: El lidar es un sensor importante para adquirir datos de nubes de puntos 3D del entorno. En el algoritmo SLAM, los datos lidar se preprocesan con operaciones como la eliminación de ruido, el filtrado y la extracción de características. El objetivo de estas operaciones es extraer información de características útiles para los procesos posteriores de estimación de la actitud y construcción de mapas.

Separación de objetos en movimiento y estáticos En entornos dinámicos, es necesario separar los objetos dinámicos de los fondos estáticos. Este paso suele basarse en los resultados de la segmentación semántica y en conocimientos a priori para distinguir los objetos dinámicos de los fondos estáticos mediante la comparación de las propiedades de movimiento de los datos de la nube de puntos con modelos conocidos del entorno. Esto filtra eficazmente la influencia de los objetos dinámicos y mejora la precisión de la estimación de la actitud y la construcción de mapas.

Estimación de la postura: La estimación de la postura se utiliza para inferir la posición y la orientación del robot en el entorno mediante el análisis de los datos de los sensores. El algoritmo SLAM basado en lidar suele utilizar el filtro de Kalman extendido (EKF) o métodos de optimización no lineal para la estimación de la actitud. La información de restricción semántica puede utilizarse para restringir el proceso de estimación de la pose con el fin de mejorar su precisión y robustez.

Construcción de mapas: La construcción de mapas es la integración de los datos de los sensores adquiridos en el entorno en un mapa 3D. El algoritmo SLAM basado en lidar puede generar mapas que contengan etiquetas semánticas integrando los datos lidar con información semántica. Un mapa de este tipo puede proporcionar más información sobre la estructura y las características del entorno, proporcionando un contexto más rico para la navegación y la toma de decisiones de los robots inteligentes.

Con el desarrollo de la IA, el 5G y el IoT, el problema de la percepción y la localización de robots inteligentes en entornos dinámicos se ha convertido en un campo de investigación muy popular. Los algoritmos SLAM basados en lidar de WiMi combinan las técnicas de FCN y segmentación semántica, lo que puede resolver eficazmente los retos deSLAM en entornos dinámicos, y tiene las ventajas técnicas de SLAM en entornos dinámicos, y tiene las ventajas técnicas de precisión, robustez, robustez, y tiene la ventaja técnica de la eficiencia de la precisión, robustez, la ventaja técnica de la precisión, robustez, y robustez, robustez, comprensión de la escena y localización de robots inteligentes.