Wayve acaba de lanzar un vídeo de un Renault Twizy
Dos postdoctorados de Inteligencia Artificial de la Universidad de Cambridge apuestan por el aprendizaje automático como base de los automóviles autónomos. Su compañía, Wayve, acaba de lanzar un vídeo de un Renault Twizy equipado para enseñarse a sí mismo a seguir un camino desde cero, en el transcurso de unos 20 minutos.
Amar Shah y Alex Kendall de Wayve creen que ha habido demasiada ingeniería manual mientras las personas intentan resolver el problema del automóvil sin conductor.
"La pieza que falta del rompecabezas autocontrolador es la de algoritmos inteligentes, no más sensores, reglas y mapas", dice Shah, cofundador y CEO de Wayve. "Los seres humanos tienen una fascinante capacidad para realizar tareas complejas en el mundo real, porque nuestros cerebros nos permiten aprender rápidamente y transferir conocimiento a través de nuestras muchas experiencias. Queremos dar a nuestros vehículos mejores cerebros, no más hardware".
Con ese enfoque en mente, el equipo tomó un Renault Twizy, equipado con una sola cámara en el frente y modificado con la capacidad de operar por computadora la dirección, el acelerador y los frenos. Lo conectaron a una unidad de procesamiento de gráficos capaz de analizar inteligentemente en tiempo real los datos de la cámara, y ejecutaron un programa de aprendizaje basado en la experimentación, la optimización y la evaluación.
Pusieron al Twizy en un angosto y suavemente curvado carril. Un conductor humano se sentó en el asiento del conductor, luego le dio control total al auto, sin decirle cuál era su tarea, y dejó que experimentara con los controles.
Cada vez que el coche se salía del camino, lo detenían y lo corrigían. El algoritmo "penalizó" al automóvil por cometer errores y lo "recompensó" en función de lo lejos que viajó sin intervención humana. En 20 minutos, lo que representaba menos de 20 ensayos, el automóvil había calculado cómo seguir un carril más o menos indefinidamente.
Wayve cree que la calidad de los sistemas de aprendizaje será el factor clave en quién dominará en la próxima década el mercado del automóvil autónomo.
"DeepMind nos ha demostrado que los métodos de aprendizaje de refuerzo profundo pueden llevar a un desempeño sobrehumano en muchos juegos, incluidos Go, Chess y juegos de computadora, casi siempre superando a cualquier sistema basado en reglas", leemos en una publicación de blog de Wayve. "Aquí demostramos que también es posible en el mundo real una filosofía similar y, en particular, en vehículos autónomos".
"Imagínese desplegar una flota de coches autónomos, con un algoritmo de manejo que inicialmente es el 95% de la calidad de un conductor humano. Tal sistema no sería tambaleante como el modelo inicializado aleatoriamente en nuestro vídeo de demostración, sino que sería casi capaz de tratar con semáforos, rotondas, intersecciones, etc. Después de un día completo de manejo y mejora en línea del conductor de seguridad humana, tal vez el sistema mejore al 96%. Después de una semana, al 98%. Después de un mes, hasta el 99%. Después de unos meses, el sistema puede ser súperhumano y se habría beneficiado de los comentarios de muchos diferentes controladores de seguridad".
Ciertamente, hay elementos de aprendizaje, y elementos de aprendizaje en red, presentes en las operaciones actuales de conducción autónoma. El piloto automático de Tesla, por ejemplo, registra cualquier error que un conductor tenga que tomar y corregir, y lo usa para ayudar a educar al otro Tesla que se dirige a través de la misma área. Pero la idea de permitir que un auto que conduce construya solo su propio modelo completo de cómo operar en el mundo, de la misma manera que lo hace un conductor humano, es fascinante.