10 preguntas sobre la visión basada en IA

El aprendizaje automático, en particular, abre una serie de posibilidades completamente nuevas que hasta ahora eran inimaginables con las tecnologías convencionales de procesamiento de imágenes basadas en reglas. No obstante, a pesar de todo este boom es fundamental analizar a fondo lo que la inteligencia artificial puede ofrecer en cada caso y cuáles son sus posibilidades reales y también sus limitaciones. Porque la IA ha venido para quedarse. Su capacidad de realizar tareas complejas con gran precisión en multitud de campos de aplicación la convierte en un activo muy valioso para las empresas. Los numerosos programas de investigación y desarrollo que hay en curso en torno a esta tecnología hacen prever nuevos e importantes avances. Con el tiempo, la IA cambiará las reglas del juego en prácticamente todos los ámbitos de nuestra vida.

¿Cómo funciona la visión artificial en las aplicaciones industriales?

En el ámbito industrial el procesamiento de imágenes basado en IA utiliza principalmente métodos de aprendizaje automático. El aprendizaje automático permite a los programas informáticos aprender de la experiencia y extraer patrones y conclusiones de manera automática a partir de los datos recopilados, sin necesidad de realizar una programación explícita. Esto se consigue adaptando modelos y algoritmos a los datos en cuestión para poder realizar predicciones, reconocer patrones y facilitar la toma de decisiones.

Los métodos basados en IA despliegan todas sus virtudes especialmente cuando se necesita procesar datos gráficos de contenido muy variado. La IA permite reconocer patrones y características que serían muy difíciles de definir unívocamente como una forma, color o posición recurrente utilizando métodos de procesamiento de imágenes basados en reglas. Y es que con la IA las características reconocibles del objeto ya no se especifican mediante una secuencia de programa determinada. En lo que se llama "fase de aprendizaje", las redes neuronales aprenden a asociar estas características con una serie de términos predefinidos ("etiquetas") visualizándolas una y otra vez. Para ello suele ser necesario disponer de una gran cantidad de imágenes de muestra de los contenidos que se desea transmitir. Cuantas más variantes gráficas se tengan de estos contenidos más estables serán los algoritmos de aprendizaje automático a la hora de reconocer las características relevantes en condiciones normales de funcionamiento, aunque se encuentren con escenas desconocidas.

¿Qué diferencias presentan los sistemas basados en IA con respecto a los sistemas existentes hasta la fecha?

Los algoritmos de procesamiento de imágenes basados en reglas suelen desarrollarse para aplicaciones específicas y son difíciles de transponer a nuevas tareas. En cambio, los modelos basados en IA pueden entrenarse para una tarea en particular pero luego utilizarse para otras tareas similares sin necesidad de empezar el entrenamiento cada vez de cero, en el marco de lo que se conoce como "aprendizaje por transferencia". Esto facilita la reutilización de modelos y acelera el desarrollo de nuevas aplicaciones de procesamiento de imágenes.

Por otro lado, las competencias clave para trabajar con métodos de aprendizaje automático ya no son las mismas que para los sistemas convencionales de procesamiento de imágenes basados en reglas. La calidad de los resultados ya no depende del código del programa desarrollado manualmente por expertos en procesamiento de imágenes, sino que viene determinada por el proceso de aprendizaje con datos de muestra adecuados. Esto significa que es necesario conocer la aplicación en profundidad y que, por tanto, con las herramientas adecuadas los análisis de viabilidad los pueden realizar los mismos expertos en la materia de la empresa, que conocen mejor que nadie el producto y sus particularidades. Así, durante la fase de evaluación las empresas dependen menos de programadores y técnicos en procesamiento de imágenes.

¿Qué sectores industriales se pueden beneficiar en mayor medida de la visión basada en IA?

Los sistemas de visión artificial basados en IA pueden clasificar las imágenes en diferentes categorías, lo que resulta muy útil en aplicaciones como el reconocimiento de imágenes o el reconocimiento y la clasificación de objetos. Además, el procesamiento de imágenes basado en inteligencia artificial puede automatizar muchas de las tareas que hasta ahora se tenían que realizar manualmente, como la identificación de fallos y defectos o la clasificación de objetos en cintas transportadoras. La capacidad de reconocer patrones y estructuras complejas en las imágenes, incluso aquellas difíciles de detectar por el ojo humano, convierte esta tecnología en una importante herramienta de control de calidad. Por tanto, la integración del procesamiento de imágenes basado en IA en estos ámbitos industriales conduce a mejoras sustanciales de la eficiencia, la calidad, la seguridad y la rentabilidad.

¿Qué ventajas clave presenta la visión IA en el ámbito del aseguramiento de la calidad?

Los sistemas de detección de anomalías, muy en particular, pueden entrenarse eficazmente para identificar productos o componentes defectuosos mediante el reconocimiento en las imágenes de irregularidades, fisuras, desviaciones de las especificaciones u otro tipo de defectos. Esto permite detectar no conformidades y eliminarlas de la cadena de producción de forma temprana, lo cual reduce el desperdicio, ahorra costes y aumenta la productividad. Puesto que los métodos de detección de anomalías basados en inteligencia artificial reconocen tanto las desviaciones conocidas como las no conocidas —por ejemplo, patrones de desgaste—, la visión IA también es una herramienta ideal para predecir las necesidades de mantenimiento en maquinaria y equipos. La detección de cualquier posible problema potencial contribuye al mantenimiento preventivo y, por tanto, minimiza los tiempos de parada imprevistos.

El incremento de los errores de producción debido al desgaste de las herramientas, la suciedad u otras influencias perturbadoras puede ser indicativo de mal estado de un sistema.
El incremento de las anomalías en una instalación puede ser indicativo del mal estado de la misma debido al desgaste de piezas, suciedad u otros factores no deseados.

¿Cómo contribuye la IA a mejorar los sistemas de visión embebida?

El hecho de que los métodos basados en IA funcionen de forma completamente distinta permite a fabricantes como IDS desarrollar nuevas herramientas para el procesamiento de imágenes con interfaces de usuario mucho más intuitivas. Estas herramientas ya hacen posible trasladar criterios de calidad hasta ahora exclusivamente humanos a sistemas de procesamiento de imágenes, lo cual es especialmente útil a la hora de desarrollar sistemas embebidos complejos, para lo cual se requerían expertos altamente especializados. El sistema de cámaras integral IDS NXT con IA incorporada es un buen ejemplo de la facilidad con que pueden desarrollarse procesos de visión artificial y ejecutarse en pequeños sistemas virtuales que no precisan un PC. El mero hecho de que gran parte del proceso de desarrollo y evaluación pueda realizarse en un servicio cloud que presenta un manejo muy fácil e intuitivo y que no requiere conocimientos especializados en IA, programación de aplicaciones o procesamiento de imágenes, pone la visión embebida al alcance de nuevos grupos de usuarios.

Además, los algoritmos basados en IA pueden paralelizarse de forma muy eficaz, es decir, acelerarse con el hardware adecuado para procesar grandes cantidades de datos en tiempo real y sin necesidad de contar con las potentes unidades de procesamiento gráfico (GPU) de los grandes centros de datos, imprescindibles hasta hace poco. Gracias a la aparición de unidades especiales de procesamiento neuronal (NPU), la visión artificial con IA integrada puede implementarse también de forma muy eficiente desde el punto de vista energético mediante pequeños dispositivos de visión embebida. Esto permite un uso escalable de la tecnología en distintas plataformas de hardware en función de los requisitos específicos de la aplicación.

El sistema de cámara IDS NXT basado en IA integra componentes de fácil manejo como un acelerador CNN, aplicaciones de visión artificial y un editor de bloques basado en web.
IDS NXT permite realizar análisis de imágenes sencillos sin conocimientos previos.

¿De qué forma puede ayudar la IA a la industria a alcanzar sus objetivos de sostenibilidad?

La supervisión y el control específicos de los procesos de producción permiten a las empresas utilizar de forma mucho más eficiente recursos como el agua, las materias primas o la energía. Un control de calidad más eficiente permite también reducir las no conformidades y, con ello, de nuevo, el consumo de recursos y energía. Las cámaras industriales con inteligencia artificial mejoran la eficiencia, la calidad y la sostenibilidad de los procesos de producción, contribuyendo con ello a minimizar el impacto medioambiental de la industria y, al mismo tiempo, a aumentar la rentabilidad económica.

¿Cuáles son los límites de la visión basada en IA?

Es difícil decir dónde están los límites de una tecnología cuando esta evoluciona de una forma tan dinámica como la inteligencia artificial y cuando todavía falta mucho camino por recorrer. Los límites del procesamiento de imágenes basado en IA se hacen patentes, por ejemplo, cuando no se consiguen los resultados deseados, aunque a veces el problema no radica necesariamente en la tecnología, sino en la falta de experiencia con dicha tecnología. El mayor reto y el mayor potencial de error al que se enfrentan los métodos basados en IA con respecto a los métodos basados en reglas reside en los datos de muestra, en la necesidad de que presenten la cantidad y la calidad adecuadas para garantizar el correcto entrenamiento de la IA. Si los modelos se alimentan con datos de mala calidad, los resultados también son deficientes. Y es que los sistemas de IA se basan en datos de los que puedan aprender el "comportamiento correcto". Si una IA se construye en condiciones de laboratorio con datos que no son representativos de las aplicaciones reales posteriores, o peor aún, si los patrones de datos presentan sesgos, el sistema adoptará esos sesgos. Las distorsiones de datos, conocidas como sesgos, pueden hacer que una red neuronal tome decisiones sesgadas durante la inferencia.

Las redes neuronales pueden entrenarse de forma fiable para una gran cantidad de tareas de visión, pero los límites y retos que van surgiendo también son numerosos. Es importante, por tanto, tener expectativas realistas sobre las capacidades de la inteligencia artificial y ser conscientes de que en algunos casos quizás pueda complementar, pero no sustituir por completo, la pericia y la capacidad de raciocinio humanas.

¿Qué retos plantean los proyectos industriales de IA?

Por todo ello es importante tener claro que la IA no es mágica ni tampoco lo suficientemente inteligente como para adivinar lo que esperamos de ella. El procesamiento de imágenes basado en IA es una herramienta muy potente cuando se utiliza correctamente. De nuevo, es importante definir exactamente qué tarea o tareas tiene que realizar el sistema de visión artificial y qué resultados espera la empresa. Cuanto más se concrete el resultado que se desea obtener, más precisos serán los contenidos didácticos necesarios para entrenar la inteligencia artificial. El reto también reside en incluir los resultados no deseados en el proceso de aprendizaje, es decir, en la transferencia de conocimientos, en lugar de intentar controlar al milímetro el proceso de toma de decisiones, como era el caso en el sistema basado en reglas. La inferencia, a la que muchos se refieren como una caja negra, es solo la suma de los datos de entrada correctos. Cuanto mejor se entrene el sistema, más probable será que se obtenga el resultado deseado. Esto requiere ciertos replanteamientos.

El funcionamiento de una red neuronal entrenada se basa únicamente en estadísticas y frecuencias, es decir, en una serie de cálculos matemáticos bastante difíciles de comprender para la mente humana. Sin embargo, con la matriz de confusión y los mapas de calor se dispone herramientas excelentes para hacer más transparentes y comprensibles las decisiones de la IA. Con la ayuda de herramientas de software de este tipo, los usuarios pueden rastrear de forma más directa el comportamiento y los resultados de la inferencia para detectar los puntos débiles del conjunto de datos entrenado y corregirlos adecuadamente. De esta forma la IA se vuelve más lógica y comprensible para todos.

¿Qué evolución cabe esperar de la visión basada en IA en el ámbito de la automatización industrial?

La tecnología ideal universal para todas las aplicaciones no existe. Por eso es importante realizar un análisis exhaustivo para determinar qué enfoque se adapta mejor a cada caso. En algunos casos, los métodos basados en reglas pueden seguir siendo los más adecuados. En otros, los sistemas de aprendizaje automático capaces de realizar tareas complejas con gran precisión pueden ser la mejor opción para muchas empresas. En pocas palabras: la inteligencia artificial no siempre es la mejor opción para cualquier tarea y no ha venido a sustituir al procesamiento de imágenes basado en reglas. Para lograr los mejores resultados, a menudo lo mejor es combinar varios métodos. Por eso, si quiere adentrarse en el mundo de la IA con éxito tiene que estar abierto a nuevas ideas y enfoques y tener ganas de experimentar. Pensar de forma diferente es una inversión a largo plazo que sin duda dará sus frutos.