Casi cualquier cosa se puede convertir en datos. Desarrollar una comprensión profunda del aprendizaje automatico ejemplos y sus diferentes tipos de datos es un requisito previo crucial para realizar el análisis exploratorio de datos (EDA) y la ingeniería funcional para modelos de aprendizaje automático.
También necesita convertir tipos de datos de aprendizaje automático de algunas variables para tomar las decisiones adecuadas para las codificaciones visuales en visualización de datos y narración de historias.
La mayoría de los datos se pueden clasificar en 4 tipos básicos desde una perspectiva de aprendizaje automatico ejemplos de datos numéricos, datos categóricos, tiempo datos en serie y texto.
Aprendizaje automatico ejemplos y tipos de datos
1. Datos numéricos
Los datos numéricos son cualquier dato donde los puntos de datos son números exactos. Los estadísticos también pueden llamar datos numéricos, datos cuantitativos.
Estos datos tienen un significado como medición como precios de la vivienda o como recuento, como el número de propiedades residenciales en Los Ángeles o cuántas casas se vendieron en el año pasado.
Los datos numéricos se pueden caracterizar en datos continuos o discretos. Los datos continuos pueden asumir cualquier valor dentro de un rango mientras que los datos discretos tienen valores distintos.
Por ejemplo, el número de estudiantes que toman clases de Python sería un conjunto de datos discretos. Solo puede tener valores discretos de números enteros como 10, 25 o 33.
Una clase no puede tener 12.75 estudiantes inscriptos. Un estudiante se une a una clase o no. Por otro lado, los datos continuos son números que pueden caer en cualquier lugar dentro de un rango. Al igual que un estudiante podría tener un puntaje promedio de 88.25 que se encuentra entre 0 y 100.
La conclusión es que los datos numéricos no están ordenados a tiempo. Son solo números que hemos recopilado.
2. Datos categóricos
Los datos categóricos representan características, como la posición, el equipo, la ciudad de origen de un jugador de hockey. Los datos categóricos pueden tomar valores numéricos.
Por ejemplo, tal vez usaríamos 1 para el color rojo y 2 para el azul. Pero estos números no tienen un significado matemático. Es decir, no podemos agregarlos juntos o tomar el promedio.
En el contexto de la super clasificación, los datos categóricos serían la etiqueta de la clase. Esto también sería algo así como si una persona es un hombre o una mujer, o una propiedad es residencial o comercial.
También hay algo llamado datos ordinales, que en cierto sentido es una mezcla de datos numéricos y categóricos. En los datos ordinales, los datos todavía se clasifican en categorías, pero esas categorías se ordenan o clasifican de alguna manera particular.
Un ejemplo sería la dificultad de clase, como principiante, intermedio y avanzado. Esos tres tipos de clases serían una forma en que podríamos etiquetar las clases, y tienen un orden natural en dificultad creciente.
Otro ejemplo es que simplemente tomamos datos cuantitativos y los dividimos en grupos, por lo que tenemos compartimientos o categorías de otros tipos de datos.
A efectos de trazado, los datos ordinales se tratan de la misma manera que los datos categóricos. Pero los grupos generalmente se ordenan de menor a mayor, de modo que podamos preservar este orden.
3. Aprendizaje automatico ejemplos: Datos de series temporales
Los datos de series temporales son una secuencia de números recopilados a intervalos regulares durante un período de tiempo.
Es muy importante, especialmente en campos particulares como las finanzas. Los datos de series de tiempo tienen un valor temporal adjunto, por lo que sería algo así como una fecha o una marca de tiempo que puede buscar tendencias en el tiempo.
Por ejemplo, podríamos medir el número promedio de ventas de viviendas durante muchos años . La diferencia entre los datos de series de tiempo y los datos numéricos es que, en lugar de tener un conjunto de valores numéricos que no tienen ningún orden de tiempo, los datos de series de tiempo tienen algún orden implícito. Se recoge un primer punto de datos y se recoge un último punto de datos.
4. Aprendizaje automatico ejemplos: Datos de Texto
Los datos de texto son básicamente palabras. Muchas veces lo primero que haces con el texto es convertirlo en números usando algunas funciones interesantes como la formulación de la bolsa de palabras.
Estos son desde la perspectiva del aprendizaje automatico ejemplos de cuatro tipos de datos. Dependiendo de exactamente el tipo de datos, esto podría tener algunas repercusiones para el tipo de algoritmos que puede usar para la ingeniería de características y el modelado, o el tipo de preguntas que puede hacer al respecto.
Avíseme si tiene alguna pregunta o comentario. Gracias por leer.