Custom Vision – Microsoft Azure (1/2)

por Anthony
0 Comentario

Hola, ha pasado poco tiempo de la Cumbre Virtual 2020 donde compartimos excelentes sesiones y sin duda aprendimos un sinfín de cosas, ya que hubo temáticas increíbles. Tuve la oportunidad de estar en algunas de esas sesiones pero hoy haré énfasis solo en una de ellas: Azure Cognitive Services, en un espacio de más de una hora compartí con toda Latinoamérica y hablé sobre los servicios cognitivos de Azure pero hubo algo que sin duda llamó mucho la atención y es que tomé como ejemplo el servicio cognitivo de Custom Vision de Azure, que es sobre lo que hablaremos en este pequeño post.

Para partir, los que no hayan podido asistir a la Cumbre Virtual, de seguro se harán algunas preguntas…

  1. ¿Qué es Microsoft Azure?

No me voy a extender mucho porque no es el tema del post, pero en conceptos básicos podemos definir a Microsoft Azure como el servicio de computación en la nube de Microsoft, donde podemos probar, construir y desplegar aplicaciones y servicios mediante el uso de centros de datos de Microsoft.

Puedes encontrar más información en: https://azure.microsoft.com/es-es/overview/what-is-azure/

Mi amigo Daniel Gomez compartió una sesión donde habla sobre Microsoft Azure, te invito a revisar la grabación: https://youtu.be/29XQVNVwOco

  1. ¿Qué son los Azure Cognitive Services?

Los servicios cognitivos de Azure son servicios basados en la nube que nos ayudan a implementar Inteligencia Artificial en nuestras aplicaciones sin la necesidad de ser unos expertos en AI o ciencias de datos.

Podemos encontrar servicios cognitivos para visión, voz, idioma, decisión y búsqueda, donde se desglosan distintas APIs que podemos usar como: detección de rostros, análisis de emociones, traducción de textos en tiempo real, etc.

Puedes encontrar más información en: https://docs.microsoft.com/en-us/azure/cognitive-services/

  1. Y en definitiva… ¿Qué es Custom Vision?

Azure Custom Vision es un servicio dentro del pilar de visión de Azure que nos permite realizar reconocimiento de imágenes mediante la creación de identificadores de imágenes. Para el identificador de imágenes debemos aplicar etiquetas que nos ayudan a diferenciar las características de objetos dentro de imágenes para luego entrenar un modelo que sea capaz de identificar correctamente estas características.

Custom Vision nos facilita muchas tareas de la parte de inteligencia artificial, como el uso de algoritmos, por ejemplo. Pero si queremos crear un clasificador que sea lo más preciso posible, si debiésemos ponerle mucha atención al entrenamiento de este, en la documentación de Microsoft se recomienda usar como mínimo 30 imágenes por cada etiqueta, aunque en el portal bastará que uses 15. Además, para lograr un modelo eficaz, se recomienda usar imágenes con variedad visual, es decir, imágenes con diferentes ángulos, iluminación, fondo, estilo, sujetos individuales o en grupos, tamaños y tipos; Esto con el objetivo de que nuestra API sea capaz de detectar con mayor eficiencia el objeto u imagen que nosotros requiriésemos.

Para el entrenamiento, se restringe algunos criterios con respecto a las imágenes como son:

  • Formato: El formato de la imagen utilizada para el entrenamiento debe ser .jpg, .png, .bmp o .gif.
  • Tamaño: El tamaño se restringe a un máximo de 6MB o 4MB para imágenes de predicción.

Teniendo en cuenta estos criterios, podemos hablar del etiquetado. El etiquetado en Custom Vision es tan simple como subir una imagen y clasificarlas de acuerdo con nuestra necesidad. En la siguiente imagen podemos ver el ejemplo de una etiqueta de fruta, que es algo general para las imágenes que se entrenarán.

Custom Vision nos presenta una evaluación de clasificador, es decir una forma de visualizar los cálculos del rendimiento de nuestro modelo que se distribuyen en dos medidas:

  • Precisión: Esta medida indica la fracción de las clasificaciones identificadas que fueron correctas. Por ejemplo, si usamos 100 imágenes de frutas y nuestro modelo identificó que 50 son realmente frutas nos presentará una precisión del 50%.
  • Coincidencia: Esta medida indica la fracción de las clasificaciones reales que se identificaron correctamente. Por ejemplo, si había realmente 100 imágenes de manzanas y el modelo identificó 80 como manzanas, la coincidencia sería del 80%.

Finalmente, podemos concluir que Custom Vision es una herramienta muy poderosa dentro de los servicios cognitivos de Azure que tiene un sinfín de aplicaciones. Además de las facilidades que nos otorga su portal y el ahorro de tiempo que significa.

Para la segunda parte de este tema, revisaremos a mayor profundidad Custom Vision, poniendo en práctica en el taller que realizamos al final de mi sesión en la Cumbre Virtual 2020 que te invito a ver en: https://youtu.be/ilYORQFu7CM

Llegado a este punto, te agradezco por tu interés en este tema y si te quedó alguna duda o crees que puedo ayudarte en algo te dejo mis contactos:

Anthony Quiranza

Microsoft Learn Student Ambassador

Mobile: (+593) 093 987 3948

[email protected]

You may also like

Deja un comentario