Visión 3D embebida

Solución todo en uno que hace la tecnología más amigable

El aprendizaje profundo abre nuevos campos de aplicación en el procesamiento industrial de imágenes que hace un tiempo eran impensables o muy difíciles de resolver. Este nuevo abordaje del procesamiento industrial de imágenes, muy distinto al tradicional, plantea nuevos retos a los usuarios y demanda un cambio de paradigma. IDS presenta una solución integral de visión embebida con la que cualquier usuario puede implementar el procesamiento industrial de imágenes basado en IA en muy pocos pasos y sin conocimientos de programación, y utilizarlo en una cámara como sistema inferencial embebido. Hace que el aprendizaje profundo sea más accesible para los usuarios.

La visión artificial y el procesamiento de imágenes se han convertido en herramientas indispensables en diversos ámbitos. Los sistemas de procesamiento de imágenes tienen que ver cada vez más con una gran diversidad de productos y variantes, y con objetos orgánicos como es la fruta, las verduras o las plantas. Los enfoques convencionales con procesamiento de imágenes basado en reglas quedan rápidamente limitados cuando los datos de imagen a analizar varían con demasiada frecuencia y resulta imposible o muy difícil describir las diferencias con algoritmos. En tales casos una automatización robusta no es viable debido a la falta de flexibilidad de las reglas. Incluso a pesar de que la tarea sea supuestamente fácil de resolver por una persona. Por ejemplo, un niño puede reconocer un coche aunque no haya visto nunca ese modelo concreto. Le basta con haber visto anteriormente una cantidad suficiente de otros modelos de coche.

Hoy día el aprendizaje artificial permite trasladar también a los sistemas de procesamiento de imágenes la capacidad de decidir de forma autónoma y flexible. Gracias a las redes neuronales y a los algoritmos de aprendizaje profundo podemos enseñar a un ordenador a ver objetos, a reconocerlos y a extraer conclusiones en base a lo aprendido. Al igual que una persona, esta "automatización inteligente" aprende y decide a partir de valores empíricos.

Diferencias con respecto al procesamiento de imágenes clásico

La diferencia principal con respecto al procesamiento de imágenes (PI) basado en reglas se encuentra en cómo y por quién son identificadas las características de la imagen y en cómo se representa el conocimiento adquirido. Con el enfoque clásico o "simbólico", un especialista en procesamiento de imágenes es el responsable de seleccionar las características de la imagen que son decisivas y de describirlas en base a ciertas reglas. Son necesarias muchas líneas de código fuente para especificar en detalle cómo resolver una tarea determinada. Porque el software solo reconoce aquello que abarcan las reglas. La ejecución subsiguiente se lleva a cabo dentro de unos límites establecidos sin ningún margen para la interpretación. Por consiguiente, el esfuerzo intelectual recae únicamente en el experto en PI.

Cuando se trabaja con redes neuronales el procedimiento es muy distinto. La ventaja estriba precisamente en que se aprenden de forma autónoma las características de la imagen que son importantes para extraer las conclusiones correctas. Por consiguiente hablamos de un "enfoque no simbólico", dado que el conocimiento solo es implícito y no permite revisar las soluciones aprendidas. Solo la cantidad y el contenido de las imágenes de entrenamiento influyen en las características que se guardan, en cómo se ponderan y en qué conclusiones se extraen. Los algoritmos de aprendizaje profundo reconocen y analizan todo el contenido de las imágenes y relacionan las características identificadas con los "conceptos" a aprender en función de la frecuencia de aparición. La frecuencia estadística genera en el entrenamiento lo que denominamos experiencia. Cassie Kozyrkov, especialista de Google en inteligencia artificial, definió como "herramienta de programación" el aprendizaje artificial en la WebSummit 2019 celebrada en Lisboa. Permite enseñar cosas a una máquina a través de ejemplos en lugar de a través de muchas instrucciones.

Por consiguiente, para desarrollar aplicaciones de visión artificial basadas en IA es necesario un cambio de paradigma. Es importante entender que la calidad de los resultados (es decir, la velocidad y la fiabilidad en el reconocimiento de objetos) depende de lo que reconoce una red neuronal y de las conclusiones que puede extraer. Aquí juega un papel decisivo el conocimiento del técnico correspondiente, que debe preparar los juegos de datos adecuados para el entrenamiento con la mayor cantidad posible de imágenes de ejemplo junto con los conceptos a aprender. La responsabilidad que asumía un especialista en procesamiento de imágenes en el método clásico, en el aprendizaje artificial la asume un especialista en datos.

Inicio inmediato con la solución integral de aprendizaje artificial

La intención de IDS es ayudar al usuario con la nueva tecnología desde los primeros pasos. IDS combina la experiencia de aprendizaje profundo con la tecnología de la cámara por medio de una solución integral de cámara inferencial. Esto permite a cualquier usuario empezar a usar inmediatamente el procesamiento de imágenes basado en IA. IDS allana el camino con IDS NXT Experience Kit y proporciona herramientas sencillas y útiles con las que se pueden crear tareas inferenciales en pocos minutos y ejecutarlas inmediatamente en la cámara sin demasiados conocimientos previos.

El concepto se basa en tres componentes importantes:

  • Un software de entrenamiento para redes neuronales fácil de usar
  • y una plataforma de cámara inteligente
  • con un acelerador de IA incluido que ejecuta las redes neuronales en el hardware.

Todos los componentes han sido desarrollados por IDS y trabajan con una sintonía perfecta. Esto facilita notablemente el trabajo a los usuarios y hace que todo el sistema sea muy potente.

El software de entrenamiento basado en la nube IDS lighthouse guía paso a paso el proceso de preparación de los datos hasta el entrenamiento de la inteligencia artificial en forma de red neuronal. El usuario no entra nunca en contacto con herramientas básicas ni tiene que lidiar con la instalación de entornos de desarrollo. En calidad de aplicación web, IDS lighthouse está lista para el uso. El usuario dispone del espacio y del rendimiento de entrenamiento suficientes para todos sus proyectos con un flujo de trabajo sencillo: iniciar sesión, cargar imágenes de entrenamiento, etiquetarlas y a continuación entrenar la red deseada.

Con unos pocos ajustes de configuración, el usuario especifica los requisitos de velocidad y exactitud de su aplicación en diálogos sencillos. A continuación IDS lighthouse selecciona la red y configura los parámetros de entrenamiento necesarios de forma totalmente autónoma. Los resultados del entrenamiento ya proporcionan al usuario una buena predicción sobre la calidad de la inteligencia entrenada y permite hacer modificaciones o repetir el proceso de entrenamiento con rapidez. El sistema se mejora y se amplía continuamente. La versión más reciente del software está siempre disponible para todos sin necesidad de planificar actualizaciones ni fases de mantenimiento. De ese modo el usuario se puede concentrar completamente en resolver su aplicación sin tener que disponer él mismo el conocimiento sobre métodos de aprendizaje e inteligencia artificial.

El fabricante utiliza el "aprendizaje supervisado" (Supervised Learning) con IDS lighthouse para entrenar redes neuronales. Los algoritmos de aprendizaje profundo aprenden con parejas predefinidas de entradas y salidas. El profesor, en este caso el usuario, tiene que proporcionar el valor de función correcto de una entrada durante el aprendizaje asignando la clase correcta a un ejemplo de imagen. La red se entrena para ser capaz de crear asociaciones de forma autónoma haciendo predicciones relativas a los datos de imagen en forma de porcentajes. Cuanto mayor es el valor, más exacta y fiable es la predicción.

La interacción perfecta del software con las familias de cámaras IDS NXT rio & rome garantiza la obtención de buenos resultados rápidamente porque las redes neuronales totalmente entrenadas se pueden cargar y ejecutar directamente en una de estas cámaras sin invertir esfuerzo en la programación. Así, el usuario dispone inmediatamente de un sistema de visión embebida totalmente operativo que ve y reconoce datos de imágenes capturadas e infiere resultados a partir de éstos de forma autónoma. Con estas interfaces digitales incluso se pueden controlar máquinas directamente.

Sistema híbrido de visión embebida

IDS ha desarrollado un núcleo de IA propio llamado "deep ocean core" que ejecuta redes neuronales entrenadas aceleradas por software para la FPGA de la plataforma de cámara inteligente IDS NXT. Esto convierte a las cámaras industriales en cámaras inferenciales de alto rendimiento que aprovechan eficazmente las ventajas de la inteligencia artificial en el entorno industrial. Los análisis de imagen se llevan a cabo de forma descentralizada, evitando así cuellos de botella del ancho de banda en la transferencia. Las cámaras IDS NXT son equiparables a las CPU de sobremesa modernas en cuanto a precisión y velocidad de tareas de IA, y al mismo tiempo requieren mucho menos espacio y consumen menos energía. La posibilidad de reprogramación de la FPGA hace además que el sistema sea a prueba de futuro y disminuya los costes recurrentes y el tiempo de lanzamiento.

La perfecta coordinación del software y del hardware propios de IDS permite al usuario determinar el tiempo de inferencia máximo antes del entrenamiento. IDS lighthouse optimiza además la configuración de entrenamiento teniendo en cuenta el rendimiento del núcleo de IA de la cámara. El usuario no tendrá sorpresas durante la posterior ejecución de la inferencia, eliminando así la necesidad de hacer lentos reajustes y reentrenamientos. Una vez integrado, para el usuario el sistema IDS NXT sigue siendo 100% compatible y coherente en su comportamiento. Esto supone una clara ventaja especialmente en aplicaciones industriales certificadas.

El potente hardware hace que la plataforma de visión embebida sea mucho más que una cámara inferencial para ejecutar redes neuronales. En la próxima fase de desarrollo el usuario podrá ampliar la funcionalidad de la combinación CPU-FPGA para adaptarla a sus necesidades utilizando apps de visión artificial. Esto permite configurar y modificar las tareas de visión artificial recurrentes. Incluso se puede realizar una secuencia de procesamiento de imágenes totalmente flexible.
Por ejemplo, las imágenes capturadas se someten a un procesamiento previo antes de que una clasificación simple y rápida separe las piezas en buenas y malas. Si aparece algún error se puede cargar una red neuronal mucho más compleja en milisegundos para determinar la clase del error con mucho más detalle y transmitir los resultados a una base de datos. También se podrán diseñar soluciones a medida muy fácilmente con el kit de desarrollo de apps. Los usuarios podrán crear apps de visión artificial personalizadas en pocos pasos e instalarlas y ejecutarlas en las cámaras IDS NXT.

Las cámaras IDS NXT están concebidas como sistemas híbridos diseñados para que coexistan el preprocesamiento de datos de imagen con el enfoque clásico y la extracción de características con redes neuronales con el fin de utilizar eficazmente las aplicaciones de procesamiento de imagen en un solo aparato.

Conclusión

IDS NXT Experience Kit hace que el aprendizaje profundo esté al alcance de todos y que sea sencillo de usar. IDS presenta una combinación de hardware y software perfectamente coordinados. Por primera vez se dispone de tareas de reconocimiento inteligentes y de automatización, o se han simplificado enormemente, en muchos campos de aplicación (nuevos). Se pueden crear y ejecutar en pocos pasos y sin conocimientos de programación soluciones de procesamiento industrial de imágenes basadas en IA. El fabricante ha basado el software de entrenamiento IDS lighthouse en la nube de forma intencionada para poder escalar y adaptar el espacio de almacenamiento y el rendimiento de entrenamiento a las necesidades de los usuarios. Además, no es necesario planificar fases de actualización o mantenimiento para beneficiarse de mejoras continuas. Esto garantiza que el usuario tenga en todo momento a su disposición la versión más reciente del software. El fabricante ofrece un paquete inicial de inferencia que incluye todos los componentes necesarios para empezar con el procesamiento de imágenes basado en IA de inmediato: desde la cámara con alimentación eléctrica y objetivo hasta la licencia de entrenamiento para IDS lighthouse.

Think Inferent!