Aprendizaje automático regulado

Aprendizaje automático y aprendizaje profundo en sistemas de visión artificial

Los sistemas de visión artificial utilizan cada vez más las tecnologías de aprendizaje automático, aprendizaje profundo y redes neuronales. El significado de estos términos no siempre está claro para todos. Sin embargo, no hay que cometer el error de considerar estas tecnologías como la solución para resolver cualquier problema de visión. Es mejor conocer los límites para poder utilizar estas tecnologías de la mejor manera.

por Fabio Rosi

La inteligencia artificial en los sistemas de visión

En primer lugar, me gustaría hacer una rápida explicación de los términos y principios de funcionamiento. Me adelantaré diciendo que lo que sigue es una gran simplificación de esta compleja ciencia, con términos que no siempre son científicamente apropiados.

Aprendizaje automático, aprendizaje profundo y redes neuronales forman parte de la gran familia deInteligencia Artificial.

El Aprendizaje automático (en italiano) Aprendizaje automático) son un conjunto de algoritmos para aprender información y generar decisiones a partir de un conjunto de datos de aprendizaje sin utilizar modelos matemáticos o estadísticos predeterminados.

En la práctica, en los sistemas de visión artificial que utilizan el aprendizaje automático, se suele proporcionar al algoritmo una serie de imágenes de defectos para que luego sean reconocidos como tales.

Esta acción se denomina Aprendizaje supervisado y es el tipo de aprendizaje más utilizado en los sistemas de visión artificial de este tipo. Los datos de aprendizaje de entrada (las imágenes de los defectos y la información relacionada con su caracterización) se seleccionan manualmente, es decir, son supervisados. Toda esta información es "digerida" por el algoritmo de tal manera que identifica una regla general que le permite encontrar los defectos catalogados en las imágenes que verá de vez en cuando.

Una especie de caja mágica que aprende de las imágenes de los defectos y proporciona un juicio sobre la imagen que estás viendo en ese momento.

En nuestra caja mágica hay algunos redes neuronaleses decir, algoritmos capaces de aprender, un poco como la mente humana. En 2019, hasta 29 tipos básicos de redes neuronales5 de ellos se definen como Profundo. La principal diferencia entre un red neuronal simple y una red neuronal profunda está en el número de capas intermedias ocultas. La red neuronal simple sólo tiene una capa intermedia, a diferencia de la red neuronal profunda que tiene más de una, cada capa corresponde a un nivel diferente de abstracción del "razonamiento".

aprendizaje profundo

El Aprendizaje profundoLa elaboración de la información llevada a cabo por una red neuronal profunda suele dar resultados más fiables que los realizados por una red neuronal monocapa.

Ventajas e inconvenientes del aprendizaje automático en los sistemas de visión artificial

Machine Learning y Deep Learning son dos palabras que se utilizan mucho últimamente en el entorno de la Industria 4.0. Independientemente de los aspectos "de moda" de ambos términos, debemos entender si estas tecnologías pueden utilizarse de forma rentable.

La respuesta a esta pregunta depende del tipo de aplicación del sistema de visión.

Veamos las principales ventajas.

  • La simplicidad de la aplicación a nivel operativo es la principal ventaja. De hecho, basta con insertar las imágenes de los defectos cada vez que se producen.
  • Tras un aprendizaje conspicuo, la red "profunda" permite tener resultados bastante precisos incluso en condiciones de ruido de información, que en el caso de los sistemas de visión por ordenador significa reflejos, piezas sucias, variación de luz del entorno, etc.
  • Siempre tras un aprendizaje formado por numerosos casos, el "deep learning" es capaz de reconocer un defecto generalizado también sin haber adquirido previamente la muestra.

Ahora veamos las desventajas.

  • Lo que antes llamábamos caja mágica, es la jerga de Caja negra. El problema de la Caja Negra reside en que no permite conocer la regla que implica la elección entre el bien y el mal. Esto suele ser un gran problema que hace que el "deep learning" no sea muy fiable en muchos casos, por lo que es preferible utilizarlo en aplicaciones en las que no se requiera la seguridad del resultado.
  • Para que la lógica del Deep Learning funcione bien se necesita una cantidad importante de información. En algunas aplicaciones, más de 1000 imágenes no suelen ser suficientes para crear una regla lo suficientemente fiable.
  • Al no disponer de una lógica objetiva de elaboración basada en un modelo matemático o estadístico, la única manera de garantizar una buena probabilidad de reconocimiento del defecto es suministrar a la red neuronal todos los casos posibles de defecto en todas las posiciones, profundidades, formas y coloraciones posibles, y en algunos casos la combinación de esta información es gigantesca. Si de hecho una forma concreta no está catalogada, es fácil que el sistema no la reconozca. Puede ocurrir, por ejemplo, que no se detecten grandes defectos simplemente porque se han catalogado una serie de defectos pequeños o medianos.
  • Estas lógicas no permiten garantizar la fiabilidad en el tiempo incluso sobre defectos que antes eran reconocidos como tales. Esto se debe a que las lógicas neurales no acumulan la información, sino que la "absorben", de hecho se dice que "acumulan la experiencia" no los datos. Por eso, a medida que damos nueva información, la antigua tiende a "diluirse" en el proceso. Esta "dilución" no es un rasgo puramente negativo porque perfecciona el aprendizaje. Sin embargo, desgraciadamente no se puede estar seguro de la repetibilidad de la evaluación del sistema de visión si no se bloquea el proceso de aprendizaje.
  • Uno de los principales problemas proviene del proceso de aprendizaje supervisado. De hecho, teniendo en cuenta la cantidad de información que hay que suministrar a la red "profunda", puede producirse el error humano de suministrar un dato erróneo, es decir, un defecto que no es tal o viceversa. La red neuronal tiene la capacidad de ocultar esta adquisición errónea, lo que dificulta, si no imposibilita, la investigación de esta anomalía. El resultado es un aumento de la falta de fiabilidad del sistema.
  • El aprendizaje supervisado suficiente para que la red neuronal funcione correctamente suele tener unos costes que no justifican la operación, especialmente en relación con el grado de fiabilidad alcanzado.

Solución VEA para el aprendizaje automático en sistemas de visión

Las pruebas realizadas en algunos de nuestros clientes han demostrado que las tecnologías de Deep Learning son muy buenas porque son capaces de catalogar eficazmente un buen número de fallos, pero son caras de gestionar y no son capaces de superar el nivel de fiabilidad que tienen los actuales algoritmos propietarios en "lógica híbrida". De hecho, los actuales algoritmos VEA en "lógica híbrida" son hoy más funcionales, más rápidos de implementar y, sobre todo, más fiables y controlables que una red neuronal "profunda".

Los algoritmos en "lógica híbrida", desarrollados desde 2007 por VEA, ya adoptan un aprendizaje supervisado preestablecido basado parcialmente en la red neuronal, pero adoptando lógicas estadísticas y matemáticas para reforzar su estabilidad.

Los últimos tipos de redes neuronales profundas, junto con la creciente capacidad de elaboración de los procesadores, presentan sin embargo varias ventajas. La solución, por tanto, es minimizar los inconvenientes.

De ahí la tecnología propia Aprendizaje automático regulado. Es un conjunto de algoritmos híbridos formados por dos conjuntos distintos de lógica.

El primer grupo de "aprendizaje" está formado por lógicas de Deep Learning que aprenden la casuística de los defectos, abstrayendo los conceptos.

El segundo grupo "supervisión" está formado por lógicas híbridas capaces de evaluar si el resultado del grupo "aprendizaje" es suficientemente fiable, en el caso contrario se toman como referencia los resultados de las lógicas "supervisión".

El uso complementario de las dos lógicas ha dado hasta ahora excelentes resultados sin perder fiabilidad.

Además, el nivel de abstracción de las lógicas de Deep Learning es tan alto que permite la construcción de "paquetes" de aprendizaje preconstituidos, evitando largas y costosas sesiones de aprendizaje a costa del cliente.