Conceptos de aprendizaje automático

Hay muchos conceptos en el aprendizaje automático que es importante entender para estar al tanto. Y lo que es más importante, si va a implementar AI, vender AI, integrar AI o escribir sobre AI, es posible que desee repasar estos conceptos básicos pero avanzados para tener una base buena y sólida con la que comenzar.

Después de leer este post, su M achine I ntelligence L ganando Q uotient (o MILQ MILQ MILQ MILQ ) aumentará sustancialmente. ¿Estás listo para obtener MILQin ‘?

Precisión y recuerdo

¡¿Qué es el Cristo vivo que es precisión y recuerdo ?! A veces, cuando lees sobre precisión y recuperación, pueden sonar exactamente como lo mismo; “La precisión es la frecuencia con la que estás en lo correcto y lo recordado es la frecuencia con la que TÚ estás en lo correcto” por ejemplo. Welp, en realidad son diferentes y, desafortunadamente, son importantes para entender por qué un modelo de aprendizaje automático funciona para un caso de uso o no.

Esta es probablemente la tercera mejor manera en la que posiblemente pueda explicar la diferencia:

Digamos que usted es tratando de recordar algo, como cuántos paraguas azules has visto en tu vida. Recall describe lo bueno que eres recordando cada vez que viste un paraguas azul, a costa de confundir también algunos recuerdos de paraguas púrpuras. Digamos que viste 10 paraguas azules en tu vida y que recordaste los 10 de ellos. Pero, también recordaste incorrectamente 5 veces más que en realidad eran sombrillas púrpuras (pero las recordaste como azules). Tu retiro es 100% porque siempre lo recordaste. ¡Felicidades, raro!

Ahora precisión va a describir qué porcentaje de tus recuerdos son realmente correctos. En el extraño ejemplo anterior, de los 15 recuerdos, solo 10 eran correctos. Por lo tanto, su precisión es aproximadamente del 66%.

Entonces, ¿cuál es más importante? Bueno, depende de tu caso de uso. Si está utilizando la visión por computadora o un aprendizaje profundo para identificar el cáncer en las fotos de los lunares, podría tener sentido minimizar la cantidad de veces que le dice a un paciente que no tiene cáncer cuando lo tiene (falso negativo), incluso a riesgo. de aumentar la probabilidad de decirle a las personas que tienen cáncer cuando no lo hacen (falso positivo).

El punto es que no puedes tener ambos, hay SIEMPRE una compensación. Solo depende de lo que sea más importante para su caso de uso; ¿Obtener todos los verdaderos positivos a riesgo de obtener también algunos falsos positivos? O asegurarse de que la mayor cantidad posible de resultados sea lo más positivo posible, con el riesgo de obtener más falsos negativos.

¿Entendido? Si todavía estás confundido, no te preocupes, es complicado y difícil de recordar. Pero voy a seguir adelante … ¿ok?

Reconocimiento vs Detección

Cuando aplicas el aprendizaje automático, puedes tener algunas herramientas bastante interesantes como detección de cara y detección de logo . También puede tener reconocimiento de cara y logotipo . QUE DEMONIOS. ¿Por qué?

Permítame tratar de explicar este concepto ofreciendo algunos ejemplos de cada tipo:

Reconocimiento facial: la entrada es una imagen de un rostro, el modelo de aprendizaje automático reconoce a la persona y le devuelve el nombre. persona.

Detección de rostros: la entrada es una imagen de un rostro, el modelo le devuelve un cuadro delimitador alrededor del rostro que encontró. Le dice dónde está la cara, pero no quién es.

Reconocimiento de imágenes: la entrada es una imagen, la salida es (probablemente) múltiples etiquetas que describen esa imagen, como niebla, automóvil, monocromo, construcción, paisaje, etc. .

Detección de objetos: la entrada es una imagen específica (como un logotipo) y una imagen general sobre la cual se realiza la detección, y la salida es cuadros delimitadores alrededor de cada lugar donde aparece una imagen específica (o logotipo) en una imagen.

¿Eso ayuda a explicar la diferencia? ¿No? Excelente: estamos en una tirada, avanzando …

Clasificación

Muchas implementaciones buenas de aprendizaje automático son en realidad clasificadores. Es un artículo de noticias falsas o noticias reales, es esta imagen de una hoja una hoja de palmera, una hoja de arce o un roble venenoso, ¿es esta oración una corrida en la oración o no, etc.

Cada clase es como una opción o una etiqueta . Usted entrena a un modelo de aprendizaje automático para poner una parte de los datos de entrada (como una foto o un artículo de noticias) en una clase. Algunos modelos pueden darte un par de clases como resultados y otros solo pueden hacer una clase a la vez.

La clave es saber que debes seguir algunas reglas básicas cuando entrenas a un clasificador, de lo contrario no lo harás. funciona bien (como mi verificador de gramática).

  1. Tus datos de entrenamiento deben ser equilibrados . Eso significa que debes tener la misma cantidad de fotos de gatos que de perros. Si intentas entrenar a un modelo con clases desiguales, naturalmente tendrá un mayor sesgo hacia la clase con más ejemplos.
  2. El modelo no solo va a descubrir qué ejemplos son incorrectos. Tus datos de entrenamiento tienen que estar absolutamente limpios. Si tienes algunos ejemplos de perros en tu carpeta de gatos, entonces realmente te estás arruinando. Ve y mueve esas fotos a la carpeta de perros ahora.

Aprendizaje profundo

El aprendizaje profundo suena increíble, ¿no es así? ¿Qué podría ser mejor que el aprendizaje regular? Lo sé .. el aprendizaje profundo. Bueno, resulta que el aprendizaje profundo es impresionante, pero viene con una trampa. Primero, permítame tratar de explicar qué es el aprendizaje profundo.

La mayoría de los modelos de aprendizaje profundo se basan en redes neuronales artificiales. Una red neuronal es esencialmente capas sobre capas de nodos que se conectan entre sí de alguna manera maldita y mágica. Cuando tiene más de 1 o 2 capas entre las capas de entrada y salida, ¡tiene una red profunda! Lo que es realmente bueno es que cuando entrenas la red, de alguna manera se da cuenta de cómo organizarse para reconocer caras (por ejemplo). Puede asignar la primera capa a la agrupación de píxeles, la segunda a la detección de bordes, la tercera a la comprensión de la nariz, y así sucesivamente … pero lo resuelve por sí solo. Increíble.

Pero no lo es todo . Una regla de oro segura es que cuando escuchas un aprendizaje profundo, significa GPU. Y las GPU son caras. Así que realmente necesitas pensar en tu caso de uso. Por ejemplo, existe un gran detector de rostros que no usa para el aprendizaje profundo. Es un filtro de visión de computadora que tiene algo como una precisión del 97%. También hay una versión de aprendizaje profundo de esta detección facial. La precisión es cada vez mayor, PERO tiene un costo de rendimiento enorme. Necesitas GPUs! Mientras que la versión de visión por computadora puede ejecutarse súper rápido en una sola CPU.

Entonces, nuevamente, es una compensación.

Bueno, esto concluye su curso de maestría en aprendizaje automático.

 

Dejá un comentario