Visión 3D embebida

Datos 3D de alta resolución directamente de la cámara

Cuando se necesita supervisar de forma automatizada grandes volúmenes o varias vistas de un objeto mediante cámaras 3D — como sucede en las líneas de producción continua del sector de la automoción—, es imprescindible poder generar y procesar datos 3D de alta resolución muy rápidamente. Esto es así debido a los tiempos de ciclo predefinidos. Los sistemas de cámaras estéreo provistos de grandes sensores de 5 MP y distancias interaxiales variables proporcionan los datos de partida ideales, pero también generan una enorme cantidad de información. Sin embargo, las interfaces y el rendimiento de la CPU pueden formar rápidamente un cuello de botella cuando se trata de aplicaciones 3D que procesan un volumen de datos tan elevado.

El reto consiste en reducir las tasas de transferencia de datos y también los requisitos técnicos que han de cumplir el resto de componentes del sistema, sin que ello repercuta negativamente en la calidad de los datos y garantizando en todo momento que el sistema ocupe el mínimo espacio y trabaje de manera eficiente. Las cámaras 3D Ensenso de visión embebida de la serie XR con procesamiento de datos integrado representan la evolución lógica de estos sistemas.

En las aplicaciones de visión artificial con cámaras 3D que operan según el principio de la visión estereoscópica (Stereo Vision), las imágenes de las cámaras se procesan en alta resolución y con una elevada frecuencia de imagen a fin de poder suministrar los datos a los procesos posteriores en el menor tiempo posible. El cálculo de los datos tridimensionales —las denominadas "nubes de puntos"— a partir de las imágenes de las cámaras estéreo requiere una serie de pasos bastante complejos que hasta ahora solo se pueden realizar con potentes ordenadores industriales.*** Las exigencias cada vez más elevadas en cuanto a la calidad y la velocidad de estos datos han llevado a las cámaras estéreo 3D de última generación, como las Ensenso de la serie X, a utilizar cámaras 2D de alta resolución con interfaz Gigabit-Ethernet. No obstante, para evitar retardos de tiempo o pérdidas de datos es imprescindible que la transmisión de los datos de partida 2D al ordenador industrial encargado de procesarlos se realice aprovechando al máximo el ancho de banda de la red. Además, para no limitar todo el sistema es necesario ir ampliando constantemente la capacidad de procesamiento del hardware del ordenador industrial.

La utilización de componentes de alta calidad permite aumentar aún más el rendimiento de estos sistemas de cámaras 3D. Gracias a la posibilidad de intercambiar las cámaras 2D, la estructura flexible de la serie Ensenso X no depende de interfaces de datos concretas ni de la resolución de los sensores. Además, puede ampliarse a medida que aumentan las exigencias de velocidad, calidad y tamaño del objeto. Sin embargo, a veces, contar con cámaras GigE de alta velocidad y alta resolución, cables blindados, una tecnología de redes de alto rendimiento y un hardware potente es sencillamente demasiado caro para según qué aplicaciones. Sin mencionar el espacio que se requiere para instalar todos estos periféricos.

Con la nueva serie XR, Ensenso propone un planteamiento radicalmente diferente. Según el principio del "Internet de las cosas" (IoT), cada componente tiene una determinada función en un "sistema distribuido" y genera resultados que se utilizan directamente en otros sistemas. En el caso de una cámara 3D, esto significa que la cámara genera coordenadas tridimensionales de puntos gráficos de un objeto real.

Procesamiento 3D integrado

Gracias a un system-on-chip (SoC) integrado en el proyector Ensenso XR, la cámara lleva a cabo los procesos 3D de forma autónoma, incluido el análisis estéreo. Una vez corregida la distorsión de las lentes, se transfieren las imágenes de partida 2D a un sistema estéreo paralelo al eje (rectificación) mediante un giro virtual de las cámaras, lo cual facilita sustancialmente todos los análisis posteriores. A continuación, los algoritmos optimizados de cotejo de escenas estáticas y en movimiento buscan correspondencias entre los puntos gráficos de las parejas de imágenes tomadas. Debido a las diferentes perspectivas de las cámaras, se generan a su vez varios desplazamientos horizontales de estos puntos gráficos en el plano de las imágenes, denominados "disparidad". Dadas las relaciones geométricas que se establecen en el sistema estéreo paralelo, y tras la aplicación de los teoremas de Tales y de los datos de parámetros conocidos del sistema como las distancias focales, los tamaños de píxeles y la longitud base del sistema estéreo, dicha disparidad representa una medida en milímetros de la profundidad espacial de un punto 3D.

Una FPGA realiza en paralelo estas largas operaciones de cálculo de píxeles directamente en la cámara. De este modo, se puede obtener una tasa de transferencia de datos 3D comparable a la de un sistema Ensenso X, que realiza el análisis estéreo en un PC de sobremesa con una CPU Intel Core i7 Quad.

"El procesamiento de datos integrado combinado con la tecnología FlexView2 hacen posible un registro de los detalles de las imágenes extremadamente rápido y preciso"

— Martin Hennemann, director de producto y experto en procesamiento de imágenes 3D en IDS —

Una nueva autonomía

Aparte de su velocidad, el alto grado de autonomía de la cámara estéreo Ensenso XR aumenta su atractivo para aplicaciones 3D frente a otras cámaras de características similares. Las reducidas exigencias de potencia en cuanto a los periféricos en red y al hardware industrial simplifican la estructura global de la aplicación 3D y reducen los costes, sobre todo en el caso de sistemas multicámara.

Por lo demás, el nuevo proyector Ensenso XR dispone de una luz frontal integrada que facilita la calibración del entorno de trabajo y mejora la calidad de las imágenes de las cámaras 2D cuando la luz ambiental resulta insuficiente o no se cuenta con iluminación externa. Además de la conexión de datos GigE, está prevista la incorporación de una interfaz WiFi, una opción muy práctica para acceder temporalmente a datos y parámetros cuando el cableado resultaría complejo o muy caro.

El gran número de mejoras que incorpora la serie Ensenso XR abre nuevos campos de aplicación a la tecnología de cámaras 3D. El procesamiento de datos integrado es la evolución lógica para optimizar el intercambio de datos.