Tableau Public para explorar datos meteorológicos

Tableau Public es una poderosa herramienta de análisis de datos y visualización de datos. Ha sido ampliamente adoptado por todo tipo de empresas para ayudarlos a convertirse en más unidades de datos. Es un programa importante que muchos científicos de datos, analistas de negocios y ejecutivos pueden usar.

Este es un breve artículo que muestra cómo hacer un análisis de datos interesante y divertido con Tableau Public 2018.

Encontré algunos datos disponibles públicamente para explorar el uso de Capital Bikeshare en el área de Washington DC durante el verano de 2018. Exploraremos cómo pasajeros, el día de la semana y el tipo de usuario afectado.

Hay más de 4,300 bicicletas de Bikeshare en todo el área metropolitana de DC. Soy un miembro de Bikeshare.. ojalá hubiera más bicicletas 🙂

Datasets

Capital Bikeshare

 

 

 

 

 

Los datos de Capital Bikeshare están disponibles de forma gratuita aquí.

 

Datos meteorológicos

 

 

 

 

 

Los datos meteorológicos están disponibles de forma gratuita aquí.

 

Tableau Public

 

Tableau Public está disponible gratis aquí.

 

Los datos de Bikeshare constan de unos pocos campos.
  • Duración – Duración del viaje
  • Fecha de inicio – Incluye fecha y hora de inicio
  • Fecha de finalización: incluye fecha y hora de finalización
  • Estación de inicio: incluye nombre y número de estación de inicio
  • Estación final: incluye nombre y número de estación final
  • Número de bicicleta: incluye número de ID de bicicleta utilizado para el viaje
  • Tipo de miembro: indica si el usuario era un miembro “registrado” (miembro anual, miembro de 30 días o miembro clave de día) o un conductor “casual” (viaje único, pase de 24 horas, 3 días Pase o pase de 5 días)

Solo mirando a junio, julio y agosto de 2018 hay 1 millón de registros, así que nos detendremos en esos tres meses para este ejercicio.

Puede hacer un campo calculado una vez que esté en la hoja de trabajo de Tableau Public para que Duración sea más fácil trabajar con él.

La ​​duración se divide entre 60 si desea trabajar en minutos en lugar de segundos. O puede hacerlo con anticipación en Excel o Hojas de cálculo de Google.

De NOAA, tomé los datos de temperatura y precipitación para el Aeropuerto Nacional Reagan (DCA) desde el 1 de junio de 2018 hasta el 31 de agosto de 2018.

NOAA le envía un correo electrónico cuando los datos están listos para descargar. Solo toma un minuto. Eliminé todas las columnas en el archivo .csv excepto precipitación, temperatura máxima, y fecha usando Excel.

Tableau Public: Vinculación de archivos

Asegúrese de agregar los datos de Bikeshare a Tableau Public antes de agregar el clima dat. Esto será útil más adelante cuando cambie la clave principal de los datos de Bikeshare.

En Tableau, realice una unión para concatenar rápidamente todas sus observaciones verticalmente (también es posible agregar más filas).

Entonces es hora de agregar los datos meteorológicos. Necesitamos unirnos a los datos meteorológicos en los datos de Bikeshare.

Para que esta unión funcione, se debe usar una columna de fecha como clave: la columna compartida en ambas tablas.

La columna de Bikeshare Fecha de inicio no funciona sin modificación, porque está en fecha y hora formato mientras que el campo de fecha de datos meteorológicos está en formato de fecha.

 

tableau public date

El intérprete de datos de Tableau podría haber sido útil aquí, pero lanzó un error cada vez que intenté usarlo. Este problema ocurre con archivos de texto, incluidos archivos .csv.

Podría funcionar si guarda primero sus datos como un archivo .xls. No lo he probado.

Realmente no necesitamos tanto la Fecha de inicio y Fecha de finalización columnas para este análisis, así que convertí la columna Fecha de finalización en un tipo de datos Fecha .

En realidad, me tomó un poco de tiempo averiguar cómo lograr que Tableau Public guarde una nuevo campo de base de datos para unirse.

El truco es que Tableau Public no guardará el cambio en el tipo de datos hasta que haga clic en una hoja de trabajo. Luego puede volver a la pestaña Fuente de datos y hacer la unión.

tableau public union

Tableau Public: Diversión en visualización y análisis de datos

Hice algunas hojas de trabajo con visualizaciones que exploran diversos aspectos de los datos. Luego combiné varios de ellos en un tablero y una historia que puedes ver aquí .

Los paneles e historias pueden integrarse en la mayoría de los sitios web, pero Medium no permite el código html o javascript integrado, por lo que lo que ve a continuación es una captura de pantalla.

tableau public weather summer 2018

 

tableau public rides per day of the week

Nuevamente, para la versión interactiva, vaya aquí . Una gran parte del poder de Tableau  Public se encuentra en sus gráficos interactivos, por lo que le recomiendo que lo compruebe.

Los dos gráficos principales son gráficos de dos ejes. No me gustan los gráficos de eje dual porque generalmente no son tan intuitivos como me gustaría, pero pueden mostrar la relación entre dos variables decentemente bien. La alta precipitación coincide con el bajo número de pasajeros en varios casos.

Si bien parece que la lluvia podría predecir una menor cantidad de pasajeros, creo que tenemos que romper la hora del día, ya que la lluvia en la noche o temprano en la mañana probablemente tenga muy poco efecto en el número de pasajeros. Dejaremos ese análisis para un día futuro.

Tableau Public: La temperatura tampoco afectó claramente a los pasajeros.

Me sorprendió ver cuánto pasajeros había más los jueves y los viernes durante el verano que los días anteriores. la semana. El gráfico de barras Paseos por día de la semana hace que esta relación sea clara.

También fue interesante ver que los miembros montaron durante períodos de tiempo mucho más cortos que los miembros ocasionales que no son ciclistas.

Esto tiene sentido ya que los miembros son principalmente viajeros y los que no son miembros son turistas que ven sin prisa las vistas del centro comercial.

Los miembros fueron responsables de casi tres veces más viajes que los no miembros durante los tres meses. Sería interesante ver si esta división crece a medida que la temporada turística disminuye.

Tableau Public no tiene muchas herramientas estadísticas integradas, aunque está agregando más. Puedes ajustar una línea de tendencia y aprender si hay algunas correlaciones.

La única correlación significativa (p <.05) que encontré a través de la regresión lineal fue entre la fecha y la temperatura: se hizo más caliente durante el verano. No es un shock allí.

Conclusión

En este artículo encontramos algunas ideas interesantes sobre el uso de Bikeshare en Washington DC mediante el uso de Tableau y la combinación de dos conjuntos de datos disponibles públicamente.

Tableau Public hace que el análisis de datos sea rápido; solo tomó unas pocas horas encontrar, limpiar y unir los datos, crear el tablero y escribir este artículo.

Hay muchos análisis y proyectos relacionados que sería útil explorar, además de los mencionados anteriormente . Sería interesante ver los datos desde el inicio del programa en 2010 para ver cómo ha aumentado el número de pasajeros.

También sería interesante crear un pronóstico para el número de usuarios que utilizan el aprendizaje automático.

Tableau Public no permite enlaces fáciles al código python, pero el Tableau Desktop, que recientemente saltó a $ 70 por usuario, sí lo hace.

Finalmente, Bikeshare está a punto de presentar sus primeras bicicletas electrónicas. Podría ser interesante profundizar en esos datos en unos pocos meses para ver cómo se usan.

Los invito a probar Tableau Public si no lo han hecho. Udemy’s Tableau 10 A-Z: Hands-On Tableau Training para Data Science! es un gran entrenamiento económico para cualquiera que busque mojarse los pies.


Explorando Tableau con Capital Bikeshare y Weather Data fue publicado originalmente en Towards Data Science en Medium, donde las personas continúan la conversación por destacando y respondiendo a esta historia.

Dejá un comentario