OpenEMMA: Una nueva era en la conducción autónoma impulsada por modelos de lenguaje multimodales

La conducción autónoma ha sido un campo de intensa investigación en los últimos años, a medida que las empresas y los investigadores buscan desarrollar sistemas cada vez más capaces y seguros. Sin embargo, los desafíos asociados con la comprensión de escenarios de conducción complejos y la toma de decisiones en tiempo real han dificultado el progreso.

Recientemente, ha surgido un nuevo enfoque prometedor que aprovecha el poder de los Modelos de Lenguaje Multimodales (MLLMs) para abordar estos retos. Un ejemplo destacado de este avance es OpenEMMA, un marco de trabajo de código abierto para la conducción autónoma de principio a fin.

OpenEMMA, desarrollado por investigadores de la Universidad de Texas A&M, Cranberry-Lemon University y otras instituciones, utiliza una combinación de MLLMs y técnicas avanzadas de razonamiento para lograr una planificación de trayectorias eficiente y precisa.

La clave del enfoque de OpenEMMA radica en su uso del proceso de razonamiento en cadena de pensamiento (Chain-of-Thought). En lugar de generar directamente la trayectoria futura, el modelo primero produce representaciones intermedias como vectores de velocidad y curvatura, que luego se integran para obtener la trayectoria final. Este enfoque se inspira en la forma en que los humanos conducen, lo que le confiere una mayor interpretabilidad y alineación con el mundo real.

Además, OpenEMMA incorpora un modelo especialista visual, específicamente YOLO11n, para mejorar la detección de objetos 3D en escenarios de conducción. Esto permite al sistema percibir con precisión los elementos clave del entorno, como otros vehículos, peatones y señales de tráfico, lo que es fundamental para una conducción segura y eficiente.

Un aspecto notable de OpenEMMA es su capacidad de adaptarse a una variedad de MLLMs diferentes, como LLaVA-1.6, Llama-3.2 y Qwen2-VL. Los experimentos realizados en el conjunto de validación del conjunto de datos nuScenes demuestran que OpenEMMA supera de manera significativa a los enfoques de línea de base, lo que demuestra su efectividad, generalización y robustez.

Quizás lo más emocionante es que OpenEMMA es de código abierto, lo que lo convierte en una plataforma accesible para que la comunidad de investigación continúe explorando y mejorando los sistemas de conducción autónoma basados en MLLMs. Al compartir el código, los conjuntos de datos y los pesos de los modelos, los autores esperan acelerar el progreso en este campo emocionante.

En resumen, OpenEMMA representa un importante avance en la conducción autónoma, aprovechando los últimos avances en MLLMs y técnicas de razonamiento para lograr una planificación de trayectorias eficiente y precisa. A medida que la comunidad de investigación continúe explorando y refinando este enfoque, es emocionante imaginar el impacto que puede tener en el futuro de la movilidad autónoma.

Link al proyecto: https://github.com/taco-group/OpenEMMA

Difunde esta nota

Publicaciones Similares

  • “El Decreto del Presidente nos deja sin facultades de flexibilizar medidas”

    El Intendente Marcelo Orazi hizo referencia a las medidas y restricciones contempladas en el Decreto de Necesidad y Urgencia (DNU) firmado por el Presidente de la Nación que, indicó, “nos deja sin la posibilidad tanto a la Gobernadora como a los intendentes de flexibilizar algunas medidas”. En este sentido, Orazi señaló que durante la semana…

    Difunde esta nota
  • Código Civil del Buen Delincuente (Actualización)

    El Código Civil del Buen Delincuente se propone como un eslabón imprescindible para una pacífica convivencia social. Veremos algunos extractos para una mejor comprensión. El artículo 22 del Código Civil del Buen Delicuente refiere que: • Todo aquel individuo que realice una actividad delictiva, deberá vestir prolijamente para la ocasión, atarse los cordones para evitar…

    Difunde esta nota
  • Más de 300 operarios paralizan una planta de Granja Tres Arroyos por deudas salariales

     

     Granja Tres Arroyos, una de las avícolas más grandes del país, profundiza la grave crisis que arrastra del año pasado. Los más de 300 trabajadores de la planta ubicada en Pilar mantienen una medida de fuerza en reclamo por deudas salariales.

    En concreto, los operarios acusan a la empresa de adeudarles la primera quincena de enero y alrededor del 50% del aguinaldo.

    «Nos prometieron que nos iban a pagar y la empresa no cumplió», dijo Diego Núñez, delegado de la planta de Pilar. En la planta, hay operarios que aseguraron que, en pos de acompañar la crisis de la empresa, incluso aceptaron una reducción salarial de hasta el 11%.

    En promedio, los montos adeudados van entre 700 mil y un millón de pesos por operario. Más allá de este conflicto puntual, los trabajadores señalaron que la crisis lleva un año.

    Según expuso Pilar a Diario, un trabajador con 10 años de antigüedad expuso que la empresa debe unas 50 horas trabajadas el año pasado. «Todos estamos endeudados, la mayoría alquila. No se puede seguir trabajando así», dijo.

     En promedio, los montos adeudados van entre 700 mil y un millón de pesos por operario. Más allá de este conflicto puntual, los trabajadores señalaron que la crisis lleva un año. 

    El panorama conflictivo también se da en la planta La China, en Concepción del Uruguay, donde los operarios iniciaron un paro en enero tras el incumplimiento del cronograma de pagos que la empresa había pactado antes de las fiestas.

    Sin embargo, la intervención del Gobierno entrerriano hizo que en las últimas horas la medida de fuerza allí se levante y la empresa pueda seguir faenando casi 190.000 pollos por día en ese establecimiento.

    Tras el cierre de Becar (Concepción del Uruguay) y el traslado de 270 operarios a La China, el Grupo Granja Tres Arroyos concentró parte de su operación en Entre Ríos bajo un esquema de dos turnos.

    También, el año pasado se dieron cerca de 400 desafectaciones entre despidos, retiros y acuerdos. Sin embargo eso no alcanzó para terminar con el conflicto.

     

    Difunde esta nota
  • |

    GALLETTA HIZO PODIO EN LA 1° FECHA DEL PATAGÓNICO MX

    Este fin de semana se corrió la 1ra fecha  del MX Patagónico, este inicio de campeonato logró ubicarse, con muy buen atino por parte de los organizadores junto a la fecha aniversario de la ciudad de San Martín de los Andes. Con jornadas de entrenamiento y competencia con un clima más que agradable y con…

    Difunde esta nota
  • COMPETENCIA EN EL SKATEPARK DE ROCA

    Natural Park, concesionario del skate park de General Roca organizó este fin de semana (18-19/03) un torneo de skate para categorías iniciantes, principiantes y amateur. La convocatoria fue buenísima, tanto de competidores como de público. Tocaron bandas en vivo y la entrada fue a beneficio con la donación de útiles escolares. Federico Gonzalez, Facundo Roldán…

    Difunde esta nota
  • RELÁMPAGO DE SÉMOLA #37 – Misceláneo (2)

    Sonata del perro de Mozart (fragmento) (…)La cena show comenzará todos podrán alimentarseYa no solo con perdices, ya no solo con fernetTendremos una orquesta que tocará para nosotros¡Pero si ya están aquí los violinistas,Grandes maestros que vienen a hacer más ameno este festínFestín!Y usté, caballero, no haga cumplidosY préndale cartucho al langostinoY sírvase un poco…

    Difunde esta nota