¿Qué es una hipótesis en el aprendizaje automático?

El aprendizaje automático supervisado a menudo se describe como el problema de aproximar una función de destino que asigna entradas a salidas.

Esta descripción se caracteriza como una búsqueda exhaustiva y evaluar hipótesis candidatas a partir de espacios de hipótesis.

La discusión de hipótesis en el aprendizaje automático puede ser confusa para un principiante, especialmente cuando “ hipótesis ” tiene un significado distinto, pero relacionado en estadística (por ejemplo, prueba estadística de hipótesis ) y más ampliamente en ciencia (por ejemplo, hipótesis científica).

En este post, descubrirá la diferencia entre una hipótesis en ciencia, en estadística y en aprendizaje automático.

Después de leer este post, sabrá:

  • Una hipótesis científica es una explicación provisional para las observaciones que es falsificable.
  • Una hipótesis estadística es una explicación sobre la relación entre las poblaciones de datos que t se interpreta de forma probabilística.
  • Una hipótesis de aprendizaje automático es un modelo candidato que se aproxima a una función de destino para la asignación de entradas a salidas.

Comencemos.

Una suave Introducción a las hipótesis en el aprendizaje automático
Foto de Bernd Thaller algunos derechos reservados.

Descripción general

Este tutorial está dividido en cuatro partes; son:

  1. ¿Qué es una hipótesis?
  2. Hipótesis en estadística
  3. Hipótesis en el aprendizaje automático
  4. Revisión de hipótesis

¿Qué es una hipótesis?

Una hipótesis y una explicación para algo. [19659006] Es una idea provisional, una conjetura educada que requiere una evaluación.

Una buena hipótesis es verificable; puede ser verdadero o falso.

En ciencia, una hipótesis debe ser falsificable, lo que significa que existe una prueba cuyo resultado podría significar que la hipótesis no es cierta. La hipótesis también debe encuadrarse antes de que se conozca el resultado de la prueba.

… no será suficiente ninguna hipótesis. Hay una condición fundamental que cualquier hipótesis o sistema de hipótesis debe satisfacer si se le otorga el estatus de una ley o teoría científica. Para formar parte de la ciencia, una hipótesis debe ser falsificable.

– Páginas 61-62, ¿Cómo se llama a esto ciencia? Tercera edición, 1999.

la evidencia y puede usarse para hacer predicciones sobre nuevas observaciones o nuevas situaciones.

La hipótesis que mejor se adapta a la evidencia y puede usarse para hacer predicciones se llama teoría o es parte de una teoría.

  • Hipótesis en la ciencia : explicación provisional que se ajusta a la evidencia y puede ser confirmada o refutada.

Hipótesis en la estadística

Gran parte de la estadística se refiere a la relación entre las observaciones.

Las pruebas de hipótesis estadísticas son técnicas utilizadas para calcular un valor crítico denominado “efecto “. El valor crítico se puede interpretar para determinar la probabilidad de que se observe el efecto si no existe una relación.

Si la probabilidad es muy pequeño, entonces sugiere que el efecto es probablemente real. Si la probabilidad es grande, es posible que hayamos observado una fluctuación estadística y que el efecto probablemente no sea real.

Por ejemplo, podemos estar interesados ​​en evaluar la relación entre las medias de dos muestras, por ejemplo. si las muestras se tomaron de la misma distribución o no, si hay una diferencia entre ellas.

Una hipótesis es que no hay diferencia entre las medias poblacionales, según las muestras de datos.

Esta es una hipótesis de no tiene efecto y se denomina hipótesis nula y podemos utilizar la prueba de hipótesis estadística para rechazar esta hipótesis o dejar de rechazarla. No decimos “aceptar” porque el resultado es probabilístico y aún podría estar equivocado, solo con una probabilidad muy baja.

… desarrollamos una hipótesis y establecemos un criterio que usaremos al decidir si retener o rechazar nuestra hipótesis. La hipótesis principal de interés en la investigación en ciencias sociales es la hipótesis nula

– Páginas 64-65, Estadísticas en inglés sencillo tercera edición, 2010.

Si se rechaza la hipótesis nula, entonces asuma la hipótesis alternativa de que existe alguna diferencia entre los medios.

  • Hipótesis nula (H0) : No sugiere ningún efecto.
  • Hipótesis alternativa (H1) : Sugiere algún efecto

Las pruebas de hipótesis estadísticas no comentan el tamaño del efecto, solo la probabilidad de la presencia o ausencia del efecto en la población, según las muestras de datos observadas.

  • Hipótesis en las estadísticas : Explicación probabilística acerca de la presencia de una relación entre las observaciones.

Hipótesis en el aprendizaje automático

El aprendizaje automático, específicamente el aprendizaje supervisado, se puede describir como el deseo de utilizar los datos disponibles para aprender una función que mejor mapea nputs to output.

Técnicamente, este es un problema llamado aproximación de función, en el que estamos aproximando una función de destino desconocida (que suponemos que existe) que puede asignar mejor las entradas a las salidas en todas las observaciones posibles del dominio del problema.

Un ejemplo de un modelo que se aproxima a la función objetivo y realiza asignaciones de entradas a salidas se denomina hipótesis en el aprendizaje automático.

La elección del algoritmo (por ejemplo, red neuronal) y la configuración del algoritmo (por ejemplo, topología de red e hiperparámetros) definen el espacio de posibles hipótesis que el modelo puede representar.

El aprendizaje de un algoritmo de aprendizaje automático implica navegar por el espacio de hipótesis elegido hacia la mejor o una hipótesis lo suficientemente buena que se aproxime mejor a la función objetivo.

Aprender es una búsqueda a través del espacio de posibles hipótesis para una que funcionará bien, incluso en nuevos ejemplos más allá del conjunto de entrenamiento.

– Página 695 , Inteligencia Artificial: Un Enfoque Moderno Segunda Edición, 2009.

Este encuadre del aprendizaje automático es común y ayuda a entender la elección del algoritmo, el problema del aprendizaje y la generalización, e incluso el sesgo. Desviación de la variación. Por ejemplo, el conjunto de datos de entrenamiento se usa para aprender una hipótesis y el conjunto de datos de prueba para evaluarla.

Se usa una notación común donde minúscula-h ( h ) representa una hipótesis específica dada y mayúscula -h ( H ) representa el espacio de hipótesis que se está buscando.

  • h ( hipótesis ) : una sola hipótesis, por ejemplo una instancia o modelo candidato específico que asigna entradas a salidas y se puede evaluar y usar para hacer predicciones.
  • H ( conjunto de hipótesis ) : Un espacio de posibles hipótesis para mapear entradas

La elección del algoritmo y la configuración del algoritmo involucra la elección de un espacio de hipótesis que se cree que contiene la elección del encuadre del problema, la elección del modelo y la configuración del modelo. una hipótesis que es una buena o mejor aproximación para la función objetivo. Esto es muy desafiante y, a menudo, es más eficiente hacer una verificación de un rango de diferentes espacios de hipótesis.

Decimos que un problema de aprendizaje es realizable si el espacio de hipótesis contiene la función verdadera. Lamentablemente, no siempre podemos decir si un problema de aprendizaje dado es realizable, porque la verdadera función no se conoce.

– Página 697, Inteligencia artificial: un enfoque moderno Segunda edición, 2009.

Es un problema difícil y optamos por restringir el espacio de hipótesis tanto en términos de tamaño como en términos de la complejidad de las hipótesis que se evalúan para hacer que el proceso de búsqueda sea manejable.

Existe un compromiso entre la expresividad de un espacio de hipótesis y la complejidad de encontrar una buena hipótesis dentro de ese espacio.

– Página 697, Inteligencia artificial: un enfoque moderno Segunda edición, 2009.

  • Hipótesis en el aprendizaje automático : Modelo candidato que se aproxima a una función objetivo para mapear ejemplos de entradas a salidas.

Revisión de hipótesis

Podemos resumir las tres definiciones de la siguiente manera:

  • Hipótesis en la ciencia : explicación provisional que se ajusta a la evidencia y puede ser confirmada o refutada.
  • Hipótesis en estadística : Explicación probabilística sobre la presencia de una relación entre las observaciones.
  • Hipótesis en la máquina : Modelo candidato que se aproxima a una función objetivo para mapear ejemplos de entradas a salidas.

Podemos ver que una hipótesis en el aprendizaje automático se basa en la definición de una hipótesis más amplia en la ciencia.

Justo como una hipótesis En ciencia, una explicación que cubre la evidencia disponible, es falsificable y se puede usar para hacer predicciones sobre nuevas situaciones en el futuro, una hipótesis en el aprendizaje automático tiene propiedades similares.

Una hipótesis en el aprendizaje automático:

  1. Cubre la evidencia disponible : el conjunto de datos de entrenamiento.
  2. Es falsificable (tipo de) : se diseña un arnés de prueba de antemano y se usa para estimar el rendimiento a y compárelo con un modelo de referencia para ver si es hábil o no.
  3. Puede usarse en nuevas situaciones : haga predicciones sobre nuevos datos.

¿Acaso esta publicación aclaró sus preguntas sobre qué ¿La hipótesis está en el aprendizaje automático?
Hágame saber en los comentarios a continuación.

Lecturas adicionales

Esta sección proporciona más recursos sobre el tema si desea profundizar.

Libros

Posts

Discusiones

Artículos

Resumen

En esta publicación, descubrió la diferencia entre una hipótesis en ciencia, en estadística y en aprendizaje automático.

Específicamente, aprendió :

  • Una hipótesis científica es una explicación provisional para las observaciones que es falsificable.
  • Una hipótesis estadística es una explicación sobre la relación entre poblaciones de datos que se interpreta de forma probabilística.
  • Una hipótesis de aprendizaje automático es un modelo candidato que se aproxima una función de destino para asignar entradas a salidas.

¿Tiene alguna pregunta?
Haz tus preguntas en los comentarios a continuación y haré todo lo posible para responder.


Compartir Compartir

Google Plus

The post ¿Qué es una hipótesis en el aprendizaje automático? apareció por primera vez en Maestría en aprendizaje automático .

https://platform.twitter.com/widgets.js

Dejá un comentario