Ver más lejos con LIDAR utilizando el seguimiento
Introducción
La tecnología siempre ha sido una herramienta para liberarnos de nuestras tareas más aburridas. Para muchos de nosotros en el mundo moderno, pocas cosas son más tediosas que estar atrapados en el tráfico en nuestros viajes diarios por la mañana, o lidiar con la hipnosis en la carretera y el tráfico de fin de semana largo durante horas y horas. Si bien esto ha generado mucho entusiasmo por los vehículos autónomos (AV), la perspectiva de piezas de metal de 2 toneladas moviéndose sin supervisión también ha llevado a un enfoque renovado en la tecnología para permitir su operación segura.
Con el fin de lograr la seguridad sobrehumana1, un mapa 3D detallado de varios objetos dinámicos (como otros automóviles, peatones y bicicletas) generalmente se considera esencial para un AV. Los sensores de detección y alcance de luz (LIDAR) a menudo se consideran entre los sistemas más útiles para tener a bordo, ya que son capaces de formar mapas tan detallados. Un ejemplo de tal mapa se muestra en la Figura 1.
Cuanto más lejos pueda un vehículo autónomo detectar de forma fiable la presencia de un objeto en la carretera, más fácil se vuelve una maniobra evasiva. Los investigadores de Analog Garage (el centro de tecnología de Analog Devices) investigaron cómo ampliar el rango de detección de los sistemas LIDAR y desarrollaron una forma de utilizar las restricciones físicas en el movimiento de los objetos para ampliar el rango. Para entender esto, primero explicamos el principio de funcionamiento de LIDAR.
Cómo funciona LIDAR
Los sistemas LIDAR disparan un pulso láser a un objeto y miden el tiempo que tarda la luz en reflejarse en el objeto y regresar al sensor, como se muestra en la Figura 2. Al escanear el láser a lo largo de las direcciones horizontal y vertical, se forma un sistema LIDAR. un mapa 3D completo de la escena frente a él. Cada uno de estos mapas se llama marco. Los sistemas LIDAR modernos suelen tener velocidades de fotogramas entre 10 y 30 fotogramas por segundo (fps).
Una vez que el láser ha disparado en una dirección particular, un sensor registra la luz que proviene de esa dirección, la convierte en una señal eléctrica y busca en esa señal la ubicación de la forma del pulso láser, utilizando una técnica llamada filtro coincidente. La salida del filtro adaptado se compara con un umbral y, si la señal cruza el umbral, se declara una detección.
Límites de detección
Por supuesto, nada en el mundo real es ideal. El proceso de detección en LIDAR introduce ruido, tanto el ruido eléctrico de los diversos componentes del receptor como el ruido óptico del propio detector. Por lo tanto, un objeto es detectable solo mientras recibe suficiente luz de él para que el filtro emparejado pueda distinguir esa señal del ruido.
La física nos dice que la intensidad de la luz cae como el cuadrado de la distancia que ha recorrido desde su fuente. En la práctica, eso significa que la cantidad de luz láser reflejada recibida por el sistema LIDAR de un objeto a 200 m de distancia es solo una cuarta parte de la luz que se habría recibido si el mismo objeto hubiera estado a 100 m de distancia.
De ello se deduce que nuestro filtro emparejado tendrá más dificultades para ver objetos más lejanos y, en el extremo, cuando un objeto se aleja lo suficiente, se volverá invisible para el sistema LIDAR. La Figura 3 demuestra esto: la amplitud de la señal de retorno del automóvil que estamos capturando cae precipitadamente con la distancia y, a 220 m de distancia, la señal es esencialmente indistinguible del ruido y el umbral de detección establecido no la detecta.
Podríamos solucionar este problema estableciendo un umbral de detección realmente bajo, de modo que el automóvil a 220 m en la Figura 3 sea visible. Obviamente, dado el nivel de SNR, también detectaríamos mucho ruido. Ahora, un marco completo de datos en 3D tiene una serie de destellos, algunos de los cuales corresponden a un objeto y otros son solo ruido. Como ejemplo, la Figura 4 muestra todas las detecciones (posteriores al umbral) en un solo corte vertical (es decir, en un ángulo vertical fijo) de un marco LIDAR. La mayoría de las detecciones son solo ruido, pero algunas corresponden a un objeto real. ¿Cómo podemos saber cuál es cuál? Si bien esto es difícil de hacer con un solo marco, se vuelve más factible después de haber visto algunos marcos de datos.
El proceso de la luciérnaga
Para entender por qué, podemos modelar los destellos de esta manera: supongamos que hay una luciérnaga zumbando alrededor de una caja y vemos un destello de la luciérnaga a intervalos regulares. Desafortunadamente, también vemos destellos aleatorios del entorno, y esos podrían ocurrir en cualquier lugar. Para empeorar las cosas, a veces perdemos destellos de la luciérnaga, y la posición que medimos para la luciérnaga generalmente no es del todo perfecta.
La pregunta fundamental que hacemos es: "Dada una secuencia de destellos, donde cada uno es un destello de un solo cuadro, ¿podemos decir si toda la secuencia proviene de una luciérnaga o no?" El término técnico dado a tales preguntas es prueba de hipótesis. La información que tenemos para tomar una decisión es que los fotogramas llegan 10 veces por segundo (para una velocidad de fotogramas de 10 fps), y una luciérnaga solo puede moverse de forma físicamente razonable en ese tiempo. Por ejemplo, una luciérnaga no puede viajar a lo largo de la caja en un marco, ya que sería una velocidad físicamente poco realista; y no puede invertir la dirección en 2 fotogramas, ya que sería una aceleración físicamente poco realista.
Dicho de otra manera, la información que podemos usar es que la pista seguida por una luciérnaga debe ser una pista que, de hecho, podría haber tomado un objeto físico. La aplicación de estas restricciones basadas en pistas nos permite distinguirlas de las pistas creadas por el ruido. El lenguaje de la prueba de hipótesis nos permite determinar y aplicar la forma matemática de las restricciones dadas pistas de cualquier longitud. Dados los destellos de dos y tres fotogramas consecutivos, las restricciones son simplemente límites en la velocidad y la aceleración de la pista. Para pistas más largas, las restricciones no tienen una interpretación tan simple, pero resultan ser bastante simples de aplicar.
Resultados
La Figura 5 demuestra la efectividad de la técnica en dos escenas simples. La imagen de la izquierda es el verdadero mapa de lo que hay en el marco, con objetos como el camino eliminados por simplicidad. La imagen del medio muestra lo que obtendríamos del procesamiento convencional con un umbral razonable y, a la derecha, lo que obtendríamos después del procesamiento firefly. El proceso firefly detecta objetos a casi 300 m de distancia. Los sistemas LIDAR de última generación tienen alcances de unos 150 m.
La Tabla 1 muestra la detección (%) y el número de falsos positivos (por cuadro) obtenidos del proceso firefly y el procesamiento convencional (MF significa filtro coincidente). El umbral de detección se establece de modo que tengamos un 99,9 % de confianza según las estadísticas recopiladas previamente de que un pico en particular corresponde a un objeto. Sin embargo, la tasa de detección es muy baja. El uso de las restricciones de pista ayuda bastante.
Tamaño de cluster | Longitud | Detectar % | Falso Pos. | |
Luciérnaga | 3 4 5 6 7 8 9 10 |
67.7 65,6 61.5 58.8 55.1 51.6 46,9 40.6 |
3.14 0.12 0.04 0.02 0.03 0.02 0.00 0.00 |
|
Pico frecuencia intermedia 99,9 % | 1 10 20 50 |
19.1 18.0 13.1 6.7 |
52.00 14.34 0.00 0.00 |
Conclusión
El proceso firefly describe un límite sobre cómo se pueden mover los objetos, es decir, detalla las restricciones, no en el detector o la cadena de señales, sino en el objeto que están midiendo. Creemos que su poder para mejorar la tasa de detección contiene una lección importante: los problemas de la cadena de señales y la detección convencional a menudo se pueden mejorar en gran medida mediante la utilización de restricciones e ideas que provienen del exterior del sistema que estamos diseñando. Esperamos seguir aprovechando estos conocimientos para diseñar cadenas de señales más inteligentes y sofisticadas, y seguir obteniendo ventajas de la explotación de restricciones no convencionales siempre que podamos.
El autor desea agradecer a Jennifer Tang, Sefa Demirtas, Christopher Barber y Miles Bennett por sus contribuciones a este artículo.
Nota
1 Si bien no existe un estándar aceptado para la seguridad de los objetivos, entre el 94 % y el 98 % de los accidentes se pueden atribuir, al menos en parte, a un error humano; consulte el libro blanco “La seguridad es lo primero para la conducción automatizada(SaFAD) en daimler.com.
Referencias
Tang , Jennifer , Atulya Yellepeddi , Sefa Demirtas y Christopher Barber “Seguimiento para mejorar la calidad de detección en LIDAR para conducción autónoma.” Conferencia internacional IEEE sobre acústica, voz y procesamiento de señales (ICASSP). Mayo 2020.
Si quieres conocer otros artículos parecidos a Ver más lejos con LIDAR utilizando el seguimiento puedes visitar la categoría Generalidades.
Deja una respuesta
¡Más Contenido!