La regresión lineal es la forma más simple de Machine Learning que existe. En esta publicación, veremos cómo funciona la regresión lineal y cómo implementarla en Python desde cero.
Te dejo un video con la explicación, míralo aquí:
https://medium.com/media/6e3166daa3b4eb451f1e874d17a2da0f/href
Regresión lineal
En las estadísticas, la regresión lineal es un enfoque lineal para modelar la relación entre una variable dependiente y una o más variables independientes.
En el caso de una variable independiente, se llama regresión lineal simple. Para más de una variable independiente, el proceso se llama regresión lineal múltiple. Nos ocuparemos de la regresión lineal simple en este tutorial.
Deje que X sea la variable independiente y Y sea la variable dependiente. Definiremos una relación lineal entre estas dos variables de la siguiente manera:
Esta es la ecuación para una línea que aprendiste en la escuela secundaria. m es la pendiente de la línea y c es la intersección y. Hoy usaremos esta ecuación para entrenar nuestro modelo con un conjunto de datos dado y predecir el valor de Y para cualquier valor dado de X .
Nuestro objetivo hoy es determinar el valor de m y c que proporciona el error mínimo para el conjunto de datos dado. Haremos esto utilizando el método de mínimos cuadrados .
Machine Learning Regresión lineal: Encontrando el error
De modo que para minimizar el error necesitamos una forma de calcular el error en primer lugar. Una función de pérdida en Machine Learning es simplemente una medida de cuán diferente es el valor previsto del valor real.
Hoy utilizaremos la Función de pérdida cuadrática para calcular la pérdida o el error en nuestro modelo. Se puede definir como:
Lo estamos cuadrando porque, para los puntos debajo de la línea de regresión y – p será negativo y no queremos valores negativos en nuestro error total.
Machine Learning Regresión lineal: Método de mínimos cuadrados
Ahora que hemos determinado la función de pérdida, lo único que queda por hacer es minimizarla. Esto se realiza encontrando la derivada parcial de L equiparándolo a 0 y luego encontrando una expresión para m y c . Después de hacer los cálculos, nos quedan estas ecuaciones:
Aquí x̅ es la media de todos los valores en la entrada X y ȳ es la media de todos los valores en la salida deseada Y . Este es el método de mínimos cuadrados. Ahora implementemos esto en python y hagamos predicciones.
Implementando el modelo
https://medium.com/media/9f90c5b3b0b1563d2fa44638e3c7cc37/href
https://medium.com/media/0a387dcff6477a90040c1b841f7d33da/href
No habrá mucha precisión porque simplemente estamos tomando una línea recta y forzándola a encajar en los datos proporcionados de la mejor manera posible . Pero puede usar esto para hacer predicciones simples o hacerse una idea de la magnitud / rango del valor real. También este es un buen primer paso para principiantes en Machine Learning.
Encuentra aquí el conjunto de datos y el código: https://github.com/chasinginfinity/ml-from-scratch/tree/master/ 01% 20Linear% 20Regresión% 20using% 20Least% 20Squares