OpenEMMA: Una nueva era en la conducción autónoma impulsada por modelos de lenguaje multimodales

La conducción autónoma ha sido un campo de intensa investigación en los últimos años, a medida que las empresas y los investigadores buscan desarrollar sistemas cada vez más capaces y seguros. Sin embargo, los desafíos asociados con la comprensión de escenarios de conducción complejos y la toma de decisiones en tiempo real han dificultado el progreso.

Recientemente, ha surgido un nuevo enfoque prometedor que aprovecha el poder de los Modelos de Lenguaje Multimodales (MLLMs) para abordar estos retos. Un ejemplo destacado de este avance es OpenEMMA, un marco de trabajo de código abierto para la conducción autónoma de principio a fin.

OpenEMMA, desarrollado por investigadores de la Universidad de Texas A&M, Cranberry-Lemon University y otras instituciones, utiliza una combinación de MLLMs y técnicas avanzadas de razonamiento para lograr una planificación de trayectorias eficiente y precisa.

La clave del enfoque de OpenEMMA radica en su uso del proceso de razonamiento en cadena de pensamiento (Chain-of-Thought). En lugar de generar directamente la trayectoria futura, el modelo primero produce representaciones intermedias como vectores de velocidad y curvatura, que luego se integran para obtener la trayectoria final. Este enfoque se inspira en la forma en que los humanos conducen, lo que le confiere una mayor interpretabilidad y alineación con el mundo real.

Además, OpenEMMA incorpora un modelo especialista visual, específicamente YOLO11n, para mejorar la detección de objetos 3D en escenarios de conducción. Esto permite al sistema percibir con precisión los elementos clave del entorno, como otros vehículos, peatones y señales de tráfico, lo que es fundamental para una conducción segura y eficiente.

Un aspecto notable de OpenEMMA es su capacidad de adaptarse a una variedad de MLLMs diferentes, como LLaVA-1.6, Llama-3.2 y Qwen2-VL. Los experimentos realizados en el conjunto de validación del conjunto de datos nuScenes demuestran que OpenEMMA supera de manera significativa a los enfoques de línea de base, lo que demuestra su efectividad, generalización y robustez.

Quizás lo más emocionante es que OpenEMMA es de código abierto, lo que lo convierte en una plataforma accesible para que la comunidad de investigación continúe explorando y mejorando los sistemas de conducción autónoma basados en MLLMs. Al compartir el código, los conjuntos de datos y los pesos de los modelos, los autores esperan acelerar el progreso en este campo emocionante.

En resumen, OpenEMMA representa un importante avance en la conducción autónoma, aprovechando los últimos avances en MLLMs y técnicas de razonamiento para lograr una planificación de trayectorias eficiente y precisa. A medida que la comunidad de investigación continúe explorando y refinando este enfoque, es emocionante imaginar el impacto que puede tener en el futuro de la movilidad autónoma.

Link al proyecto: https://github.com/taco-group/OpenEMMA

Difunde esta nota

Publicaciones Similares

  • Moyano sostiene a su triunviro en la nueva conducción de la CGT y la UTA se bajó

     

    Hugo Moyano hizo valer su gravitación en el nuevo esquema de conducción de la CGT y sostuvo como triunviro a su hombre de confianza, Octavio Argüello, quien reemplazó el año pasado a Pablo Moyano, que se retiró de la cúpula cegetista tras fuertes discrepancias con sus pares por el rol de la central obrera frente al Gobierno.

    Ahora, el dirigente camionero estará acompañado por Cristian Jerónimo (Vidrio) y Jorge Sola (Seguros), ambos dirigentes que ya venían con un respaldo mayoritario para asumir en el nuevo triunvirato.

    Pero el surgimiento del nuevo consejo directivo durante el congreso de este miércoles en Obras Sanitarias generó fuertes tensiones con sectores que pretendían terminar con el formato vigente de conducción y volver al unicato.

    Entre ellos, estaban los colectiveros de la UTA, los ferroviarios de La Fraternidad y el gastronómico Luis Barrionuevo que, como contó LPO, ya se había ausentado del encuentro previo que la CGT hizo la semana pasada en la sede de la Uocra.

    Fracasada la propuesta de unicato al someterse a votación, tanto Barrionuevo como el titular de la UTA, Roberto Fernández, abandonaron la votación y no integraron sus gremios en el nuevo consejo directivo.

    Arguello, Sola y Jerónimo, el nuevo triunvirato de la CGT

    Dirigentes que participaron del congreso escucharon amenazas de ruptura y reminiscencias a la CGT Azul y Blanca que entre 2008 y 2016 lideró Barrionuevo, pero en el gremialismo que permanece en la CGT descreen de esas advertencias, sobre todo porque aseguran que el gastronómico ya no concentra el poder de fuego de otros tiempos.

    Como sea, lo cierto es que también hubo expresiones de malestar desde otras representaciones. La titular de los Trabajadores Viales, Graciela Aleña, expuso su bronca por la ausencia de mujeres en el nuevo triunvirato, algo que se había barajado seriamente, incluso en la reunión de la Uocra el jueves último.

    «No venimos por la foto, no servimos el café, queremos a las compañeras conducir la CGT», fue uno de los cánticos que se escucharon en Obras por parte de las dirigentes sindicales.

    La CGT llamó a la unidad para enfrentar la reforma laboral pero faltó Barrionuevo

    «Tengo bronca. No puede ser que haya dirigentes históricos que todavía entren a última hora y te cambien una lista que ya estaba decidida», dijo Aleña al salir de la votación. Aunque no quiso dar nombres, la referencia parece apuntar a Hugo Moyano.

    Más allá del cupo femenino, esa bronca de Aleña tampoco pasa desapercibida considerando que la titular del gremio de Viales reporta directamente a Pablo Moyano, cada vez más distanciado de su padre.

    Como contó LPO, a pesar de algunos reparos con los nombres del triunvirato y la distribución de cargos, los gremios más cercanos al kirchnerismo, con la UOM al frente, seguirán integrando el consejo directivo.

     Dentro de los cambios, Héctor Daer pasará a la Secretaría de Interior y Omar Plaini (Canillitas) ocupará Finanzas, mientras que el Sindicato de Comercio estará representado por Daniel Lovera en lugar de Armando Cavalieri.  

    El líder metalúrgico Abel Furlán esta vez no está en la Secretaría Gremial, sino que puso ahí a uno de sus hombres de confianza, Osvaldo Lobato.

    En tanto, continúan en sus cargos Andrés Rodríguez (Adjunta), Gerardo Martínez (Relaciones Internacionales), José Luis Lingeri (Acción Social), Sergio Romero (Políticas Educativas) y Sergio Sasia (Vivienda).

    Dentro de los cambios, Héctor Daer pasará a la Secretaría de Interior y Omar Plaini (Canillitas) ocupará Finanzas, mientras que el Sindicato de Comercio estará representado por Daniel Lovera en lugar de Armando Cavalieri. 

     

    Difunde esta nota
  • Se continúa trabajando en la reparación de calles de ripio de la ciudad.

    El personal municipal y las máquinas viales, se encuentran desarrollando tareas en los barrios 25 de Mayo, Antártida y Ara San Juan. Además, se llevan a cabo tareas de mantenimiento, corte de yuyos en terrenos baldíos, tanto municipales como privados. Estos últimos, deberían ser mantenidos por los propios titulares de dichos terrenos. Difunde esta nota

    Difunde esta nota
  • PASEMOS A OTRO TEMA

    No caben dudas. Fabio Zerpa tiene razón: hay marcianos entre la gente. El otro día vi uno en televisión, dice llamarse el cabezón Duhalde. La verdad es que no sé muy bien que hacen los extraterrestres de sus vidas. Pero de algo estoy seguro, algunos, como el cabezón: son agitadores de masas. Supongo que hay…

    Difunde esta nota
  • WIKIWIKI DE LA URL

    ¿Querías sondear la gravísima incontestable somera traslación del 4G a la www? No, no, son muy alejados los imborrables ojos que el mar de google esconde entre sus azulados subterfugios como para armar un fluido rompecabezas de pulcros <url>. Ahora dime, ¿hay grumos de indigestión en la batería baja de un camaleón informático cuando la…

    Difunde esta nota
  • |

    Invap: «Esta tecnología nos permite ser competitivos internacionalmente»

    La empresa estatal rionegrina firmó un contrato para construir dos radares de uso civil que serán exportados a Nigeria y emplazados en el principal aeropuerto de ese país. La construcción de dos radares de uso civil por el Instituto de Investigaciones Aplicadas (Invap), que serán exportados a Nigeria y emplazados en el principal aeropuerto de…

    Difunde esta nota