Reconocimiento de objetos
Inteligencia Artificial
Marcos Barraza Urquidi
La novedad en algunos celulares es que ahora se desbloquean “viéndonos la cara”, en el buen sentido de la palabra, la versión anterior “veÃa” nuestra huella digital.
Conceptualmente es muy sencillo, se captura en un elemento fotosensible la imagen, se establece la resolución que se va a dar a la imagen, esto es cuantos puntos por pulgadas (pixeles), a cada pixel se le asignan tres números dependiendo de que tanto rojo, verde o azul tenga, estos números se meten en una matriz.
El que se metan en una matriz nos permite ahorrarnos el “anotar” la posición de cada punto, a través de varios algoritmos se simplifica la imagen para que se tengan solo lÃneas de contornos y elementos descriptivos del objeto.
Por ejemplo, vamos a suponer que un agricultor de Cuauhtémoc quiere hacer un sistema para detectar manzanas, lo primero que tiene que hacer es enseñarle a la maquina como es una manzana, para esto lo tiene que alimentar con muchos ejemplos de manzanas, toma una foto de una manzana de lado y le dice esto es una manzana, luego una foto desde arriba y de nuevo le dice esto es una manzana, hace lo mismo de diferentes ángulos y repite este proceso con muchos tipos de manzana, luego con objetos parecidos a la manzana y ahora le dice que no es una manzana.
Termina el agricultor con una colección de imágenes positivas “es manzana” y otro tanto de imágenes negativas que le dicen: ”aguas esto no es una manzana”.
El siguiente paso es la extracción de caracterÃsticas propias de la manzana o del objeto que se quiera analizar, estas caracterÃsticas se transforman a vectores (magnitud y dirección) para independizarlas de su tamaño, una manzana chica sigue siendo manzana, lo mismo la muy grande.
Aquà podrÃa surgir una pregunta lógica ¿Para que le puede servir a un agricultor un equipo de detección de manzanas si el las está viendo y solo produce manzanas? Bueno, si el detector de imágenes se hace con receptores de infrarrojos le puede dar información de que manzanas están maduras y cuales no, o si tienen gusanos etc. Y no mandará producto que le puedan regresar.
Inicialmente este proceso requerÃa de equipos con grandes recursos de computación, pero asà como las máquinas aprenden, los fÃsicos y matemáticos también por lo que se han desarrollados ingeniosos algoritmos que nos permiten con pocos recursos, como un teléfono, comparar imágenes, aunque nada es gratis, sacrificamos precisión por economÃa.
El proceso es igual con las caras, se hace un primer recorrido y se anota la parte donde puede haber caras, luego en cascada se vuelve a recorrer la imagen para comprobar si esos cuadros son en realidad una cara, esto ahorra mucho tiempo.
En el caso del teléfono, una vez que detecta una cara lo compara con los datos que tiene de su cara en particular y desbloquea el equipo.
En el caso de que se quiera saber quién es la persona, el proceso es más largo ya que tendrá que recorrer las imágenes en archivo para localizarla, aunque no todas, sino aquellas que tienen rasgos parecidos a la cara que están detectando, como nariz aguileña, barba partida etc.
La detección de imágenes tiene un uso extendido en la industria, el comercio y en general en muchas actividades del hombre convirtiendo a la Inteligencia artificial en nuestro aliado, por lo cual, en los foros internacionales se dice que los paÃses que inviertan en el desarrollo de IA tomarán la delantera en el concierto mundial