Plotly Experiments — Column and Line Plots

Plotly Experiments – Columnas de líneas y columnas

Foto de Ren Ran en Unsplash

Gráficas de barras

En mi entrada anterior expliqué que cómo crear diagramas de dispersión utilizando Plotly con ejemplos del conjunto de datos de viviendas del Condado de King. Otro tipo popular de gráfico es el gráfico de columnas o gráfico de barras. A diferencia de un diagrama de dispersión, que se usa para comparar dos variables numéricas entre sí y examinar las relaciones, los gráficos de barras / columnas son útiles para investigar una o más variables numéricas en diferentes categorías. Hay diferentes tipos de gráficos de barras: individuales, agrupados, apilados, etc.

El conjunto de datos

Usaré el conjunto de datos Bay Area Bike Share de Kaggle para este post. El Bay Area Bike Share permite viajes en bicicleta rápidos, fáciles y asequibles alrededor del área de la Bahía de San Francisco. Hacen lanzamientos regulares de datos abiertos (este conjunto de datos es una versión transformada de los datos de este enlace), además de mantener una API en tiempo real. El conjunto de datos tiene varios archivos que contienen información sobre las diferentes estaciones en el Área de la Bahía, los viajes que se realizan cada día junto con la información del clima. Usaré los conjuntos de datos de estaciones y viajes para este ejercicio de exploración de datos.

Estaciones

Veamos el conjunto de datos de estaciones:

El conjunto de datos contiene el nombre, la ubicación y la capacidad de cada estación en el Área de la bahía. ¿Qué ciudades tienen el número más alto de estaciones y capacidad (muelles)?

https://medium.com/media/682c4bbf44e1a18effa85aeb72540c0d/href [19659011cc)Estotambiénsepuederepresentaratravésdeungráficode’cascada’Vamosavercómo

https://medium.com/media/80262ecd6e9f0a09c49068e1dbf25535/href https://medium.com/media/c98c77ea896a53b6c7b630a7b9edc16c/hrepucilla de la tabla de la luz de la piscina , con ningún. de estaciones y muelles para cada ciudad agrupada.

https://medium.com/media/f41aea6096c925ef077ff89f578d671b/href https://medium.com/mediafab de cáñamo de los animales de la mano de las personas de la familia de los animales. Examinemos el conjunto de datos de viajes ahora. Esto contiene información sobre los viajes en bicicleta tomados desde y hacia las diferentes estaciones que vimos anteriormente.

Las columnas de fecha de inicio y finalización contienen información de fecha y hora que podría ser útil para nuestro análisis. Extraigamos más información de estas columnas.

https://medium.com/media/a7e81b4bae6bcc0afd5aef14d307d312/href

Hagamos algunas preguntas para responder a través de nuestras visualizaciones.

  • ¿Cuál es la distribución de la duración de los viajes?
  • ¿Cuáles son los meses / días / horas más populares entre los usuarios de bicicletas?
  • ¿Qué estaciones de bicicletas son las más populares?
  • ¿Cómo afecta el tipo de suscripción a estos parámetros?

Veremos cuadros que responden a cada pregunta arriba, junto con las variaciones causadas por la diferencia en los tipos de suscripción.

Distribución de la duración

Examinemos la distribución de la duración del viaje a través de un histograma.

https://medium.com/media/1795432810d84c8a0aaf69ec8652d800/href https://medium.com/media/126dcd4b902284b573248e0afb3471e0/href

Ahora, dividamos el histograma por tipo de suscripción y veamos si la duración del viaje varía entre clientes y suscriptores. Los suscriptores son usuarios que usan la bicicleta compartida regularmente y tienen membresía en Bay Area Bike Share. Los clientes, por otro lado, no tienen membresías y usan bicicletas a pedido.

https://medium.com/media/a04777f020de93fcd617b68affd34b5b/href .psps://medium.com/media/94c8dc2e47cc0bea4e.e.jpg 19659012] ¡Está claro que los clientes tienden a usar bicicletas por más tiempo que los suscriptores!

Tiempos populares para viajes en bicicleta

¿Cuándo la mayoría de las personas hacen viajes en bicicleta? ¿Qué horas del día, días de la semana y meses del año son los más populares entre los ciclistas? ¿Y cómo varía eso entre clientes y suscriptores? Vamos a explorar.

Meses populares del año

Comencemos por trazar el no. de viajes por mes.

https://medium.com/media/40d664ad90f710759f2e4e79cb60afe7/href https://medium.com/media/7b42da484f72b73b9435fa02ad0f9f4e/href [1965901212]. Veamos.

https://medium.com/media/2a794b209a324bb5a874a52847f87eff/href https://medium.com/media/c5279453a5e5e7b24c5ba5fac9d172/hrefccc09908905ccccc09908455/9re792b9c5ba5fac9d172/hrefcccc09908455ccccc09909455ccccccccc09907b5c5ba5c9c8ba5fac9d172/hrefccccnccccncccccccccccccccccccccccccccccccggggggggggggggggggggggggggggggggg La cantidad de viajes nos muestra que la cantidad de pasajeros tiende a ser baja en los meses de invierno y tiende a aumentar gradualmente desde la primavera hasta el verano y el otoño. La proporción de cliente a suscriptor no parece cambiar mucho según el mes. Veamos ahora cómo el día de la semana afecta la cantidad de pasajeros.

Días populares de la semana

¿En qué días de la semana los viajes en bicicleta son más altos? ¿La tendencia varía según el día de la semana y el fin de semana? Vamos a explorar. Debido a que el conjunto de datos es más grande, enfocaré nuestro análisis solo en los últimos tres meses de 2013.

https://medium.com/media/4d2c852fec4bc1461a05e5f54520dbf9/href medps://medium.com/media/f046faed3dfc28ca10ccccccccc8cc8cc8cccccc8cc8cc108c08fc3c061f03fd3dfc28ccccccccccccccccccccccccc061a05a5f54520dbf9/href / href

Claramente, el uso es menor en los fines de semana que en los fines de semana. ¿En qué se diferencia el tipo de suscripción en estos días?

https://medium.com/media/681eea4098b957692f2696dcb1437f91/href https://medium.com/media/9237ef001c16a409688f84eee496c496/href

Lo parece. es mayor en los días de semana, y menor en los fines de semana. Creo que sería mejor si trazáramos los números porcentuales en una columna apilada que los números absolutos. Podemos lograr de esta manera:

https://medium.com/media/41a361a41eba35bf7de1a5fd857b4889/href https://medium.com/media/fabec5834e4127b49cc5db7f252a9d03/href

podemos deducir lo siguiente a partir del análisis del no. de viajes en diferentes días de la semana:

  • Los suscriptores en su mayoría tienden a usar las bicicletas durante los días de semana. Esto indica que pueden usarlo para ir y venir del trabajo (podemos confirmar esto más adelante cuando hagamos el análisis por hora)
  • La mayoría de los clientes tienden a usar las bicicletas durante los fines de semana y días festivos (en la tabla anterior, puede ver que el uso del cliente fue mayor en Navidad que el de los suscriptores, aunque era un día laborable)

Horas populares del día

Veamos durante qué horas del día se usan más las bicicletas. Dado que se trata de una gran cantidad de puntos de datos, examinaré el valor de una semana, digamos la primera semana de diciembre de 2013.

https://medium.com/media/139b8473dd1ff5ac2ae35b3d3a97281e/href https: // medium.com/media/48863c298b5e3d3f767f61864053ac78/href Backlinks19659012repitEl número de viajes tiende a ser mayor durante los días de semana, especialmente durante la mañana y la noche (8AM y 5PM). Ya vimos a los suscriptores usar las bicicletas principalmente durante los días de semana. Esto confirma nuestra suposición de que los suscriptores son personas que lo utilizan principalmente para sus viajes diarios hacia y desde el trabajo.

Todo el código utilizado para generar los gráficos en este post está disponible en GitHub .

Línea Gráficos

Los gráficos de líneas son generalmente útiles para investigar la tendencia de una variable numérica a lo largo del tiempo. Cualquier análisis de series de tiempo está incompleto sin un gráfico de líneas. Hay varios tipos de gráficos de líneas: con y sin marcadores, gráficos de área, gráficos de líneas escalonadas, líneas lineales y suavizadas, etc. Exploremos estos en este cuaderno.

En Plotly, los gráficos de líneas son solo una variación de los diagramas de dispersión, Sólo con una línea que conecta los puntos. Por lo tanto, usaremos la función de dispersión (o scattergl) para propósitos de trazado.

Usemos el mismo conjunto de datos y explorémoslo usando diagramas de líneas. Para empezar, vamos a trazar el no. de viajes por fecha.

https://medium.com/media/cc99759a79838373b6e7ce0f4e44810c/href https://medium.com/media/0f1p485c880bb07eb29ac3bcdc0f4df/hrefcfcccccc0c1c489c880bb07eb29ac3bcdc0f4df/cc99f9c/cc99f9pccc0c1c48cc07b2903b29c3bcdc0f4pxccccc0c1cccccc0c1ccc0c0c4bc07eb29ac3 han tratado de abarrotar en un amplio período de tiempo en una tabla. Afortunadamente, Plotly proporciona una herramienta muy útil llamada el control de rangos, que permitirá al usuario seleccionar un período de tiempo específico con mucha facilidad. Veamos cómo.

https://medium.com/media/686d5ab085bcfabfea2ec19007604383/href https://medium.com/media/0890ecd1ef5138931b362be1da2ee1d2/href

El ” ” ” El eje x se llama el control deslizante de rango. Puede hacer clic y arrastrar los controles deslizantes para ampliar un período de tiempo específico.

Se puede ver que el número de usuarios tiende a agotarse en invierno, especialmente hacia el final del año. Permítanos trazar algunos promedios móviles para suavizar la curva y ver el patrón.

https://medium.com/media/0de4d6b2131c959c2780c12a3f3a50c7/href [19659077pcccccccccc09901k1a00a24a24a24a24a24a24a24a24a24ccccccccc09901k2a00a24a24a24a24a24a24a24a24a24a24a24a24a24a24a24a24a24a24a24a24a] Las curvas de promedio móvil muestran claramente cómo disminuye el número de pasajeros durante los meses de invierno.

Marcadores + Líneas

Ahora vamos a acercarnos a una ventana específica del marco de tiempo y hacer un análisis. Me concentraré en el segundo trimestre de 2014.

https://medium.com/media/7c81e545b741478f4aea09094a2b2955/href https://medium.com/media/dccccccccgggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggw , patrón cíclico a los datos. En el análisis de series de tiempo, esto se conoce como “estacionalidad”. Coloreamos los marcadores en función del día de la semana.

https://medium.com/media/90c0807f406925114cea97381614a8ab/href https://medium.com/media/6e22a1db256867303bc2aa30fcff7ec6/hrefest Indica que la cantidad de pasajeros baja los fines de semana. Sin embargo, ¿por qué fue baja la cantidad de pasajeros el 26 de mayo de 2014? La respuesta es aquí .

Otra forma de resaltar los fines de semana, es dibujar cuadros a través de las formas en Plotly. Veamos cómo.

https://medium.com/media/6dd32b1aead4018275b146a38c09dbc9/href https://medium.com/media/7c398b23a23c94a6aab9/href […] […] […] [País] […] […] […]. en la medida en que el área debajo de la línea se sombrea, dando al espectador una idea de la magnitud del número que se está graficando. Por ejemplo, puede ser más apropiado trazar el precio de las acciones a través de un gráfico de líneas, pero el límite de mercado a través de un gráfico de área. Los gráficos de área también son útiles cuando se usan en un modelo apilado, ya que muestran la diferencia entre dos cantidades numéricas en un área sombreada.

Veamos el conteo de usuarios como un gráfico de área con el cual comenzar.

https: // medium. com / media / dc9b03906b82425f8be3edc82c83f1af / href https://medium.com/media/d68f4b58bb3ab8d2b23459f5d8e8281/href

Permítanos ver la división en la que se encuentra la información de la empresa. /medium.com/media/1736bc9e06584184e14a421adb4f829e/href[19659097◆https://mediumcom/media/87f5b85a6cd701e63b8de600df6dcb16/hrefágc19909012IWtambiénpuedeexplicarestascondicionesenelsector] https://medium.com/mediac3c3830f687b5fdf58734b3a04bbb9ee8/href https://medium.com/media/32ba9caad8b78b6556be4c71d1a5ce/href

En este artículo: , en lugar de una línea recta que une el dos puntos. Esto le da al usuario una vista de dónde hay aumentos y disminuciones bruscos y donde los números se mantienen constantes.

https://medium.com/media/da0da5862d7cf2da0b33daee42f24b88/href https://medium.com/media/ a59897f90ec9650d278d083bf35179ab / href

Espero que este post te ayude a aprender a trazar diferentes tipos de gráficos de columnas, barras y líneas en Plotly.


Plotly Experiments – Columnas de líneas y columnas fue publicado originalmente en Science en Medium, donde las personas continúan la conversación resaltando y respondiendo a esta historia.

Dejá un comentario