Artículos técnicos

Visión 3D embebida

Datos 3D de alta resolución directamente de la cámara

Onboard-Processing Ensenso XR

Cuando se necesita supervisar de forma automatizada grandes volúmenes o varias vistas de un objeto mediante cámaras 3D — como sucede en las líneas de producción continua del sector de la automoción—, es imprescindible poder generar y procesar datos 3D de alta resolución muy rápidamente. Esto es así debido a los tiempos de ciclo predefinidos. Los sistemas de cámaras estéreo provistos de grandes sensores de 5 MP y distancias interaxiales variables proporcionan los datos de partida ideales, pero también generan una enorme cantidad de información. Sin embargo, las interfaces y el rendimiento de la CPU pueden formar rápidamente un cuello de botella cuando se trata de aplicaciones 3D que procesan un volumen de datos tan elevado.

El reto consiste en reducir las tasas de transferencia de datos y también los requisitos técnicos que han de cumplir el resto de componentes del sistema, sin que ello repercuta negativamente en la calidad de los datos y garantizando en todo momento que el sistema ocupe el mínimo espacio y trabaje de manera eficiente. Las cámaras 3D Ensenso de visión embebida de la serie XR con procesamiento de datos integrado representan la evolución lógica de estos sistemas.

En las aplicaciones de visión artificial con cámaras 3D que operan según el principio de la visión estereoscópica (Stereo Vision), las imágenes de las cámaras se procesan en alta resolución y con una elevada frecuencia de imagen a fin de poder suministrar los datos a los procesos posteriores en el menor tiempo posible. El cálculo de los datos tridimensionales —las denominadas "nubes de puntos"— a partir de las imágenes de las cámaras estéreo requiere una serie de pasos bastante complejos que hasta ahora solo se pueden realizar con potentes ordenadores industriales.*** Las exigencias cada vez más elevadas en cuanto a la calidad y la velocidad de estos datos han llevado a las cámaras estéreo 3D de última generación, como las Ensenso de la serie X, a utilizar cámaras 2D de alta resolución con interfaz Gigabit-Ethernet. No obstante, para evitar retardos de tiempo o pérdidas de datos es imprescindible que la transmisión de los datos de partida 2D al ordenador industrial encargado de procesarlos se realice aprovechando al máximo el ancho de banda de la red. Además, para no limitar todo el sistema es necesario ir ampliando constantemente la capacidad de procesamiento del hardware del ordenador industrial.

La utilización de componentes de alta calidad permite aumentar aún más el rendimiento de estos sistemas de cámaras 3D. Gracias a la posibilidad de intercambiar las cámaras 2D, la estructura flexible de la serie Ensenso X no depende de interfaces de datos concretas ni de la resolución de los sensores. Además, puede ampliarse a medida que aumentan las exigencias de velocidad, calidad y tamaño del objeto. Sin embargo, a veces, contar con cámaras GigE de alta velocidad y alta resolución, cables blindados, una tecnología de redes de alto rendimiento y un hardware potente es sencillamente demasiado caro para según qué aplicaciones. Sin mencionar el espacio que se requiere para instalar todos estos periféricos.

Con la nueva serie XR, Ensenso propone un planteamiento radicalmente diferente. Según el principio del "Internet de las cosas" (IoT), cada componente tiene una determinada función en un "sistema distribuido" y genera resultados que se utilizan directamente en otros sistemas. En el caso de una cámara 3D, esto significa que la cámara genera coordenadas tridimensionales de puntos gráficos de un objeto real.

Comparación de procesos 3D
Figura 1: Comparación de procesos 3D

Procesamiento 3D integrado

Gracias a un system-on-chip (SoC) integrado en el proyector Ensenso XR, la cámara lleva a cabo los procesos 3D de forma autónoma, incluido el análisis estéreo. Una vez corregida la distorsión de las lentes, se transfieren las imágenes de partida 2D a un sistema estéreo paralelo al eje (rectificación) mediante un giro virtual de las cámaras, lo cual facilita sustancialmente todos los análisis posteriores. A continuación, los algoritmos optimizados de cotejo de escenas estáticas y en movimiento buscan correspondencias entre los puntos gráficos de las parejas de imágenes tomadas. Debido a las diferentes perspectivas de las cámaras, se generan a su vez varios desplazamientos horizontales de estos puntos gráficos en el plano de las imágenes, denominados "disparidad". Dadas las relaciones geométricas que se establecen en el sistema estéreo paralelo, y tras la aplicación de los teoremas de Tales y de los datos de parámetros conocidos del sistema como las distancias focales, los tamaños de píxeles y la longitud base del sistema estéreo, dicha disparidad representa una medida en milímetros de la profundidad espacial de un punto 3D.

Una FPGA realiza en paralelo estas largas operaciones de cálculo de píxeles directamente en la cámara. De este modo, se puede obtener una tasa de transferencia de datos 3D comparable a la de un sistema Ensenso X, que realiza el análisis estéreo en un PC de sobremesa con una CPU Intel Core i7 Quad.

"El procesamiento de datos integrado combinado con la tecnología FlexView2 hacen posible un registro de los detalles de las imágenes extremadamente rápido y preciso."
Martin Hennemann, director de producto y experto en procesamiento de imágenes 3D en IDS

Las ventajas de un sistema embebido

Combinados con la tecnología FlexView2, los modelos de la serie XR36 son capaces de procesar una ráfaga de hasta 16 capturas de imágenes de una escena estática para generar datos 3D sin que se produzcan retardos de tiempo adicionales a causa de la transferencia de datos en bruto al PC host. Al desplazar el patrón del proyector mediante FlexView2 se generan con cada pareja de imágenes otros puntos 3D que contribuyen a una representación 3D de alta resolución.

El traslado de los complejos procesos de cálculo a la cámara evita tener que utilizar potentes ordenadores industriales que realicen esta función. Al mismo tiempo, transferir datos definitivos 3D en lugar de datos en bruto 2D de alta resolución disminuye la carga de la red. El acceso rápido y directo a la memoria entre la captura de imágenes y su procesamiento para la obtención de datos 3D de alta resolución permite mejorar la tasa de resultados y descargar el ancho de banda con respecto al procesamiento externo mediante un ordenador industrial.

El bajo consumo de recursos de la nueva serie XR beneficia particularmente a los sistemas multicámara. Si han de transferirse datos en bruto de varias cámaras 2D de alta resolución a través de la red, enseguida se producen cuellos de botella del ancho de banda e interrupciones en la frecuencia de imagen, lo que repercute negativamente en el rendimiento general. A este respecto destacan el análisis precoz y la reducción simultánea de datos de la serie XR, con unas tasas de resultados estables, unos requisitos más bajos en cuanto a la potencia de cálculo de los componentes periféricos y, con ello, una menor necesidad de espacio. Una aplicación 3D con cámaras Ensenso XR puede escalarse de forma mucho más sencilla para satisfacer los requisitos aplicables en cada momento.

Para reducir aún más la tasa de transferencia de datos, la cámara transfiere el "Disparity Map". La imagen de un canal de 16 bits es mucho más pequeña que una "nube de puntos" completa, que genera una imagen RDB de 32 bits con superposición de colores. La sencilla conversión puede realizarse en un ordenador industrial con Ensenso SDK sin cargar apenas la capacidad de la máquina.

Comparación de sistemas multicámara 3D
Figura 2: Comparación de sistemas multicámara 3D

Una nueva autonomía

Aparte de su velocidad, el alto grado de autonomía de la cámara estéreo Ensenso XR aumenta su atractivo para aplicaciones 3D frente a otras cámaras de características similares. Las reducidas exigencias de potencia en cuanto a los periféricos en red y al hardware industrial simplifican la estructura global de la aplicación 3D y reducen los costes, sobre todo en el caso de sistemas multicámara.

Aparte de la conexión Gigabit-Ethernet por cable, una interfaz WiFi adicional permite acceder temporalmente a los datos y parámetros durante la configuración y el mantenimiento, lo cual es extremadamente útil cuando el cableado resulta complejo o costoso. Por lo demás, el nuevo proyector Ensenso XR dispone de una luz frontal integrada que facilita la calibración del entorno de trabajo y mejora la calidad de las imágenes de las cámaras 2D cuando la luz ambiental resulta insuficiente o no se cuenta con iluminación externa.

El gran número de mejoras que incorpora la serie Ensenso XR abre nuevos campos de aplicación a la tecnología de cámaras 3D. El procesamiento de datos integrado es la evolución lógica para optimizar el intercambio de datos.

Serie XR Ensenso >>