Contenido
- Introducción
- Terminología
- Proceso
- Teoría de fondo
- Enfoques de aprendizaje automático
Introducción
El aprendizaje automático es una de las tecnologías más influyentes y poderosas en el mundo de hoy. Más importante aún, estamos lejos de ver todo su potencial. No hay duda, continuará apareciendo en los titulares en el futuro previsible. Este artículo está diseñado como una introducción a los conceptos de Aprendizaje automático, que abarca todas las ideas fundamentales sin tener un nivel demasiado alto.
El aprendizaje automático es una herramienta para convertir la información en conocimiento. En los últimos 50 años, ha habido una explosión de datos. Esta masa de datos es inútil a menos que la analicemos y encontremos los patrones ocultos en ella. Las técnicas de aprendizaje automático se usan para encontrar automáticamente los patrones subyacentes valiosos dentro de datos complejos que de otra manera tendríamos dificultades para descubrir. Los patrones ocultos y el conocimiento sobre un problema se pueden usar para predecir eventos futuros y realizar todo tipo de decisiones complejas.
Nos estamos ahogando en la información y nos morimos de hambre por el conocimiento – John Naisbitt
La mayoría de nosotros desconocemos que ya interactuar con Machine Learning todos los días. Cada vez que buscamos en Google, escuchamos una canción o incluso tomamos una foto, Machine Learning se está convirtiendo en parte del motor detrás de ella, aprendiendo y mejorando constantemente de cada interacción. También está detrás de avances mundiales como la detección de cáncer, la creación de nuevos medicamentos y los autos que conducen por sí mismos.
La razón por la que Machine Learning es tan emocionante es porque está a un paso de todos nuestros sistemas anteriores basados en reglas de: [19659013] if (x = y): do z
Tradicionalmente, la ingeniería de software combinó las reglas creadas por el hombre con datos a creando respuestas a un problema . En cambio, el aprendizaje automático utiliza datos y respuestas a para descubrir las reglas detrás de un problema . (Chollet, 2017)
Programación tradicional vs Aprendizaje automático
Para aprender las reglas que gobiernan un fenómeno, las máquinas tienen que pasar por un proceso de aprendizaje probando diferentes reglas y aprendiendo de su desempeño. Por lo tanto, por qué se conoce como Aprendizaje automático.
Existen múltiples formas de Aprendizaje automático; Aprendizaje supervisado, no supervisado, semi-supervisado y de refuerzo. Cada forma de aprendizaje automático tiene diferentes enfoques, pero todos siguen el mismo proceso y teoría subyacentes. Esta explicación cubre el concepto general de Inclinación de la máquina y luego se enfoca en cada enfoque.
Terminología
- Conjunto de datos : Un conjunto de ejemplos de datos, que contiene características importantes para resolver el problema.
- Características : Un factor clave de un problema que se alimenta de un algoritmo de aprendizaje automático para ayudarlo a aprender.
- Modelo : la representación (modelo interno) de un fenómeno que un algoritmo de aprendizaje automático ha aprendido de los datos que se muestran a
Proceso
- Recopilación de datos: Recopile los datos que el algoritmo aprenderá.
- Preparación de datos: Formatee e ingrese los datos en el formato óptimo, extrayendo características importantes y Realización de reducción dimensional.
- Capacitación: También conocida como la etapa de adaptación, aquí es donde el algoritmo de Aprendizaje automático realmente aprende al mostrarle los datos que se han recopilado y preparado.
- Evaluación: Te st el modelo para ver qué tan bien funciona.
- Afinación: Afina el modelo para maximizar su rendimiento.
Teoría del fondo
Orígenes
El motor analítico teje patrones algebraicos como los tejidos de Jaquard flores y hojas: Ada Lovelace
Ada Lovelace, una de las fundadoras de la informática, y quizás la primera programadora de computadoras, se dio cuenta de que cualquier cosa en el mundo podía describirse con matemáticas .
Más importante aún, esto significaba que se puede crear una fórmula matemática para derivar la relación que representa cualquier fenómeno. Ada Lovelace se dio cuenta de que las máquinas tenían el potencial de comprender el mundo sin la necesidad de asistencia humana .
Aproximadamente 200 años después, estas ideas fundamentales son fundamentales en el aprendizaje automático. No importa cuál sea el problema, su información se puede trazar en un gráfico como puntos de datos. Luego, Machine Learning intenta encontrar los patrones matemáticos y las relaciones ocultas en la información original.
Teoría de la probabilidad
La probabilidad es una opinión ordenada … la inferencia de los datos no es otra cosa que la revisión de dicha opinión a la luz de la nueva información relevante. Thomas Bayes
Otro matemático, Thomas Bayes, fundó ideas que son esenciales en la teoría de la probabilidad que se manifiesta en el Aprendizaje Automático.
Vivimos en un mundo probabilístico. Todo lo que sucede tiene una incertidumbre. La interpretación bayesiana de probabilidad es en lo que se basa el aprendizaje automático. Probabilidad bayesiana significa que pensamos en probabilidad como cuantificando la incertidumbre de un evento.
Debido a esto, tenemos que basar nuestras probabilidades en la información disponible sobre un evento más bien que contando el número de intentos repetidos. Por ejemplo, al predecir un partido de fútbol, en lugar de contar la cantidad total de veces que el Manchester United ha ganado contra el Liverpool, un enfoque bayesiano usaría información relevante como la forma actual, la clasificación de la liga y el equipo inicial. 19659009] La ventaja de adoptar este enfoque es que las probabilidades aún pueden asignarse a eventos raros, ya que el proceso de toma de decisiones se basa en características relevantes y razonamiento .
Enfoques de aprendizaje automático
Hay muchos enfoques que se pueden tomar cuando se lleva a cabo el aprendizaje automático. Por lo general, se agrupan en las áreas enumeradas a continuación. Supervisado y no supervisado son enfoques bien establecidos y los más utilizados. Semi-supervised y Reinforcement Learning son más nuevos y complejos, pero han mostrado resultados impresionantes.
El Teorema sin almuerzo gratis es famoso en Machine Learning. Afirma que no existe un único algoritmo que funcione bien para todas las tareas. Cada tarea que intentas resolver tiene sus propias idosicracias. Por lo tanto, hay muchos algoritmos y enfoques que se adaptan a las peculiaridades de cada problema. Se seguirán introduciendo muchos más estilos de Aprendizaje Automático e IA que mejor se adaptan a diferentes problemas.
- Aprendizaje Supervisado
- Aprendizaje No Supervisado
- Aprendizaje Semi-supervisado
- Aprendizaje de Refuerzo
Aprendizaje Supervisado aprendiendo, el objetivo es aprender el mapeo (las reglas ) entre un conjunto de entradas y salidas.
Por ejemplo , las entradas podrían ser el pronóstico del tiempo, y las salidas serían los visitantes a la playa. El objetivo del aprendizaje supervisado sería aprender el mapeo que describe la relación entre la temperatura y el número de visitantes a la playa.
Ejemplo etiquetado datos proporcionados de la entrada y pares de salida durante el proceso de aprendizaje para enseñar al modelo cómo debe comportarse, por lo tanto, aprendizaje ‘supervisado’. Para el ejemplo de la playa, nuevas entradas se pueden alimentar en de la temperatura pronosticada y el algoritmo de aprendizaje automático emitirá una predicción futura para el número de visitantes.
Ser capaz de adaptarse a los nuevos insumos y hacer predicciones es la parte crucial de la generalización del aprendizaje automático. En la capacitación, queremos maximizar la generalización, por lo que el modelo supervisado define la verdadera relación subyacente “general”. Si el modelo está sobre entrenado, causamos exceso de ajuste a los ejemplos utilizados y el modelo sería incapaz de adaptar a entradas nuevas, nunca antes vistas.
Un efecto secundario a tener en cuenta En el aprendizaje supervisado, la supervisión que proporcionamos introduce un sesgo en el aprendizaje. El modelo solo puede ser imitando exactamente lo que se mostró, por lo que es muy importante mostrar ejemplos confiables e imparciales . Además, el aprendizaje supervisado por lo general requiere una gran cantidad de datos antes de aprender. Obtener suficientes datos etiquetados de manera confiable es a menudo la parte más difícil y costosa de usar el aprendizaje supervisado. (¡De ahí el motivo por el cual los datos se han llamado el nuevo aceite!)
La salida de un modelo de Aprendizaje automático supervisado podría ser una categoría de un conjunto finito, por ejemplo, [low, medium, high] para el número de visitantes a la playa:
Entrada [temperatura= 20 ] -> Modelo -> Salida = [visitantes= alta ]
Cuando este es el caso, es decidir cómo clasificar la entrada por lo que se conoce como clasificación .
Alternativamente, la salida podría ser un escalar del mundo real ):
Entrada [temperatura= 20 ] -> Modelo -> Salida = [visitantes= 300 ]
Cuando este es el caso, se conoce como regresión .
Clasificación
La clasificación se utiliza para agrupar los puntos de datos similares en diferentes secciones para clasificarlos. El aprendizaje automático se usa para encontrar las reglas que explican cómo separar los diferentes puntos de datos.
¿Pero cómo se crean las reglas mágicas? Bueno, hay múltiples formas de descubrir las reglas. Todos se centran en usando datos y respuestas para descubrir reglas que puntos de datos linealmente separados.
La separabilidad lineal es un concepto clave en el aprendizaje automático. Todo lo que significa la separabilidad lineal es “¿pueden los diferentes puntos de datos estar separados por una línea?”. En pocas palabras, los enfoques de clasificación intentan encontrar la mejor manera de separar los puntos de datos con una línea.
Las líneas dibujadas entre clases se conocen como los límites de decisión . El área completa que se elige para definir una clase se conoce como la superficie de decisión . La superficie de decisión define que si un punto de datos cae dentro de sus límites, se le asignará una cierta clase.
Regresión
La regresión es otra forma de aprendizaje supervisado. La diferencia entre clasificación y regresión es que la regresión genera un número en lugar de una clase. Por lo tanto, la regresión es útil cuando se predicen problemas basados en números como los precios del mercado de valores, la temperatura para un día determinado o la probabilidad de un evento.
Ejemplos
La regresión se utiliza en el comercio financiero para encontrar patrones en las acciones y otros factores. Activos para decidir cuándo comprar / vender y obtener un beneficio. Para la clasificación, ya se está utilizando para clasificar si un correo electrónico que recibe es correo no deseado.
Tanto las técnicas de aprendizaje supervisado de clasificación como de regresión pueden extenderse a tareas mucho más complejas. Por ejemplo, tareas relacionadas con el habla y el audio. Algunos ejemplos son la clasificación de imágenes, la detección de objetos y los chatbots.
Un ejemplo reciente que se muestra a continuación utiliza un modelo entrenado con aprendizaje supervisado para videos realistas de personas que hablan.
Quizás se esté preguntando cómo se relaciona esta compleja tarea basada en imágenes. clasificación o regresión? Bueno, vuelve a todo en el mundo, incluso un fenómeno complejo, que se describe fundamentalmente con matemáticas y números . En este ejemplo, una red neuronal todavía está generando números como en regresión. Pero en este ejemplo, los números son los valores numéricos de coordenadas 3d de una malla facial .
Aprendizaje no supervisado
In unsupervised , solo se proporcionan datos de entrada en los ejemplos. No hay resultados de ejemplo etiquetados para apuntar. Pero puede ser sorprendente saber que todavía es posible encontrar muchos patrones interesantes y complejos ocultos en los datos sin etiquetas.
Un ejemplo de aprendizaje no supervisado en la vida real sería clasificar monedas de diferentes colores en pilas separadas. Nadie te enseñó a separarlos, pero solo con observar sus características como el color, puedes ver qué monedas de color están asociadas y agrupándolas en sus grupos correctos.
El aprendizaje no supervisado puede ser más difícil que el aprendizaje supervisado, ya que la eliminación de la supervisión significa que el problema se ha vuelto menos definido. El algoritmo tiene una idea menos enfocada de qué patrones buscar.
Piénsalo en tu propio aprendizaje. Si aprendiera a tocar la guitarra bajo la supervisión de un profesor, aprendería rápidamente si reutiliza el conocimiento supervisado de las notas, los acordes y los ritmos. Pero si solo aprendieras a ti mismo, te resultaría mucho más difícil saber por dónde empezar.
Al no estar supervisado en un estilo de enseñanza laissez-faire comienzas desde una pizarra limpia con menos sesgos y Incluso puede encontrar una nueva, mejor manera de resolver un problema. Por lo tanto, esta es la razón por la que el aprendizaje no supervisado también se conoce como descubrimiento de conocimientos . El aprendizaje no supervisado es muy útil cuando se realizan análisis de datos exploratorios.
Para encontrar las estructuras interesantes en los datos no marcados, usamos estimación de densidad . La forma más común de las cuales es clustering . Entre otros, también hay reducción de dimensionalidad modelos de variables latentes y detección de anomalías . Las técnicas más complejas sin supervisión incluyen redes neuronales como Autoencoders y Deep Belief Networks, pero no las analizaremos en este blog de introducción.
Agrupación
El aprendizaje no supervisado se usa principalmente para agrupación . La agrupación es el acto de creando grupos con características diferentes . La agrupación intenta encontrar varios subgrupos dentro de un conjunto de datos. Dado que este es un aprendizaje no supervisado, no estamos restringidos a ningún conjunto de etiquetas y tenemos la libertad de elegir cuántos clústeres crear. Esto es a la vez una bendición y una maldición. La selección de un modelo que tenga el número correcto de agrupaciones (complejidad) debe realizarse a través de un proceso de selección de modelo empírico.
Asociación
En Association Learning, desea descubrir las reglas que describen sus datos . Por ejemplo, si una persona ve el video A, es probable que vea el video B. Las reglas de asociación son perfectas para ejemplos como este donde desea encontrar elementos relacionados .
Detección de anomalías
El identificación de elementos raros o inusuales que difieren de la mayoría de los datos. Por ejemplo, su banco usará esto para detectar la actividad fradualant en su tarjeta. Sus hábitos de gasto normales estarán dentro de un rango normal de comportamientos y valores. Pero cuando alguien trata de robarte usando tu tarjeta, el comportamiento será diferente de tu patrón normal. La detección de anomalías utiliza el aprendizaje no supervisado para separar y detectar estos sucesos extraños .
Reducción de la dimensionalidad
La reducción de la dimensionalidad tiene como objetivo encontrar las características más importantes para reducir la característica original establecida en un conjunto más pequeño y eficiente que aún codifica los datos importantes .
Por ejemplo, al predecir la cantidad de visitantes a la playa, podemos usar la temperatura, el día de la semana, el mes y la cantidad de eventos que se discuten. para ese día como insumos. Pero el mes en realidad puede no ser importante para predecir el número de visitantes .
Las características irrelivantes de este tipo pueden confundir los algoritmos de inclinación de la máquina y hacerlos menos eficientes y precisos. Al utilizar la reducción de dimensionalidad, solo se identifican y utilizan las características más importantes . El análisis de componentes principales (PCA) es una técnica de uso común.
Ejemplos
En el mundo real, el agrupamiento se ha utilizado con éxito para descubrir un nuevo tipo de estrella al investigar qué subgrupos de estrellas se forman automáticamente en función de las características de las estrellas . En marketing, se usa regularmente para agrupar a los clientes en grupos similares según sus comportamientos y características.
El aprendizaje de la asociación se utiliza para recomendar o encontrar artículos relacionados. Un ejemplo común es el análisis de la cesta de mercado. En el análisis de la cesta de mercado, se encuentra que las reglas de asociación predicen otros artículos que un cliente probablemente comprará según lo que hayan colocado en su cesta. Amazon utiliza esto. Si coloca una computadora portátil nueva en su cesta, recomiendan elementos como un estuche para computadora portátil a través de sus reglas de asociación.
La detección de anomalías se adapta bien a escenarios como la detección de fraudes y la detección de malware.
Aprendizaje semipresencializado
El aprendizaje semi-supervisado es una mezcla de enfoques supervisados y no supervisados. El proceso de aprendizaje no se supervisa estrechamente con salidas de ejemplo para cada entrada individual, pero tampoco dejamos que el algoritmo haga lo suyo y no proporcione ningún tipo de retroalimentación. El aprendizaje semi-supervisado toma el camino del medio.
Al poder mezclar una pequeña cantidad de datos etiquetados con un conjunto de datos sin marcar mucho más grande reduce la carga de tener suficientes datos etiquetados. Por lo tanto, abre muchos más problemas para ser resueltos con el aprendizaje automático.
Redes de adversarios generativos
Las redes de adversarios generativos (GAN) han sido un avance reciente con resultados increíbles. Los GAN utilizan dos redes neuronales, un generador y discriminador . El generador genera salida y el desriminador lo critica. Al luchar entre sí, ambos se vuelven cada vez más hábiles.
Al usar una red para generar entradas y otra para generar salidas, no es necesario que proporcionemos etiquetas explícitas cada vez, por lo que puede clasificarse como semi supervisado.
Ejemplos
Un ejemplo perfecto es en las exploraciones médicas, como las exploraciones de cáncer de mama. Se necesita un experto capacitado para etiquetar esto, lo que requiere mucho tiempo y es muy costoso. En cambio, un experto puede etiquetar solo un pequeño conjunto de exploraciones de cáncer de mama, y el algoritmo semi-supervisado podría aprovechar este pequeño subconjunto y aplicarlo a un conjunto más amplio de exploraciones
Para mí, los GAN son uno de los ejemplos más impresionantes de aprendizaje semi-supervisado. A continuación se muestra un video en el que una Red generativa adversa utiliza un aprendizaje no supervisado para mapear aspectos de una imagen a otra.
El aprendizaje de refuerzos
El aprendizaje es, con mucho, mi favorito. Es menos común y mucho más complejo, pero ha generado resultados increíbles. No usa etiquetas como tales, y en su lugar usa recompensas para aprender.
Si está familiarizado con la psicología, habrá oído hablar del aprendizaje por refuerzo. Si no es así, ya sabrá el concepto de cómo aprendemos en la vida cotidiana. En este enfoque, retroalimentación positiva y negativa ocasional se utiliza para reforzar comportamientos . Piense en ello como entrenar a un perro, los buenos comportamientos son recompensados con un tratamiento y se vuelven más comunes. Los malos comportamientos son castigados y se vuelven menos comunes. Este comportamiento motivado por la recompensa es clave en el aprendizaje por refuerzo.
Esto es muy similar a cómo nosotros, como humanos, también aprendemos. A lo largo de nuestras vidas, recibimos señales positivas y negativas y aprendemos constantemente de ellas. Las sustancias químicas en nuestro cerebro son una de las muchas formas en que obtenemos estas señales. Cuando sucede algo bueno, las neuronas de nuestro cerebro proporcionan un golpe de neurotransmisores positivos, como la dopamina, que nos hace sentir bien y es más probable que repita esa acción específica . No necesitamos supervisión constante para aprender como en el aprendizaje supervisado. Al dar solo las señales de refuerzo ocasionales, aún aprendemos de manera muy efectiva.
Una de las partes más emocionantes del aprendizaje de refuerzo es que está a un primer paso de la capacitación en conjuntos de datos estáticos, y en lugar de poder usar dinámicas, ruidosas entornos ricos en datos . Esto acerca el Aprendizaje Automático a un estilo de aprendizaje utilizado por los humanos. El mundo es simplemente nuestro ruidoso y complejo entorno de datos.
Los juegos son muy populares en la investigación sobre el Aprendizaje de Refuerzos. Proporcionan entornos ideales ricos en datos. Las puntuaciones en los juegos son señales de recompensa ideales para entrenar conductas motivadas por la recompensa. Adicionalmente, se puede acelerar el tiempo en un entorno de juego simulado para reducir el tiempo total de entrenamiento.
Un algoritmo de aprendizaje de refuerzo solo apunta a maximizar sus recompensas al jugar el juego una y otra vez . Si puede enmarcar un problema con una ‘puntuación’ frecuente como recompensa, es probable que se adapte al aprendizaje por refuerzo.
Ejemplos
El aprendizaje por refuerzo no se ha utilizado tanto en el mundo real debido a lo nuevo Y lo complejo que es. Pero un ejemplo del mundo real es el uso del aprendizaje por refuerzo para reducir los costos de funcionamiento del centro de datos al controlar los sistemas de refrigeración de una manera más eficiente. El algoritmo aprende una política óptima de cómo actuar para obtener los costos de energía más bajos. Cuanto más bajo es el costo, más recompensa recibe.
En la investigación se usa frecuentemente en juegos. Los juegos de información perfecta (donde puedes ver todo el estado del medio ambiente) y la información imperfecta (donde partes del estado están ocultas, por ejemplo, el mundo real) han visto un éxito increíble que supera a los humanos.
Google DeepMind ha usado el aprendizaje por refuerzo en la investigación para jugar a los juegos de Go y Atari a niveles sobrehumanos.
¡Eso es todo para la introducción a Machine Learning! Esté atento a más blogs próximamente que profundizarán en temas específicos.¡Gracias! 🤖🧠