Análisis de abandono con Machine Learning

INTRODUCCIÓN

Recientemente, me encontré con un CEO de una exitosa compañía SaaS (~ $ 10mm ARR) creando herramientas de compromiso con el cliente, en una reunión de fundadores en Palo Alto. Mientras discutíamos las aplicaciones del aprendizaje automático en los negocios SaaS, la conversación pasó rápidamente a la gestión de la rotación de clientes. Todas las empresas en el mercado de consumo y los sectores empresariales tienen que lidiar con la rotación de clientes, ya que podría afectar los números de ingresos de la empresa y, por lo tanto, influir en ellos. decisiones políticas.

Según los autores de “Leading on the Edge of Chaos” un aumento del 2% en la retención de clientes (o disminución de la rotación) es equivalente a una reducción del 10% en los costos. así que no es de extrañar que las empresas de SaaS (y las que se preocupan por los clientes) presten mucha atención a Churn Analysis. Además, según la Oficina de Asuntos del Consumidor de la Casa Blanca, es de 6 a 7 veces más costoso adquirir un nuevo cliente que retener a uno antiguo.

El CEO de esta compañía en particular ha estado usando la gestión tradicional de abandono retroactiva basada en la simple modelo estadístico. Su equipo ha estado enumerando los churners de alta propensión y atendiendo sus necesidades a través de servicios especiales de conserjería. Esto ha introducido nuevos pasos en el flujo de trabajo de la aplicación y ha impactado la productividad general en todos los departamentos, especialmente los equipos involucrados en el diseño de UX, pruebas A / B y mensajes de mercado. El equipo de negocios se dio cuenta de que este tratamiento especial para clientes agitados no es un proceso sostenible y necesitan una estrategia de gestión holística integral que tenga en cuenta el riesgo (y la tolerancia de riesgo asociada), el nivel y el costo de la intervención de retención para diferentes segmentos de clientes. más sistémico y continuo.

“Solo hay dos fuentes de ventaja competitiva, la capacidad de aprender más sobre nuestros clientes más rápido que la competencia y la capacidad de convertir ese aprendizaje en acción más rápido que la competencia”

– Jack Welch El ex presidente y director general de General Electric

Customer Churn se refiere a la tasa de desgaste del cliente en una empresa o, en palabras más simples, a la velocidad a la que el cliente abandona su empresa o servicio. Entre los ejemplos de pérdida de clientes se incluyen

Cancelación de una suscripción
Cierre de una cuenta
No renovación de un contrato o acuerdo de servicio
Decisión de comprar en otra tienda
Usar otro proveedor de servicios

La deserción puede ocurrir debido a muchas razones diferentes y el análisis de la deserción ayuda a identificar la causa (y el momento) de esta deserción, lo que abre oportunidades para implementar estrategias de retención efectivas. Aquí hay 6 pasos comprobados para asegurarse de que se está enfocando en retener a sus clientes; nos enfocaremos solo en el paso 2 y en las partes del paso 3 de este artículo. Al mismo tiempo, recuerde que no se trata de culpar al producto o al grupo de éxito del cliente por la rotación, sino a crear una estrategia para mejorar la retención de clientes.

Reúna el comportamiento del cliente, las transacciones, los datos demográficos y los patrones de uso disponibles
. puntos de datos para predecir segmentos de clientes con probabilidad de deserción
Cree un modelo para configurar la tolerancia al riesgo de la empresa con respecto a la probabilidad de deserción.
Diseñe un modelo de intervención para considerar cómo el nivel de intervención podría afectar los porcentajes de deserción. y valor de vida útil del cliente (CLV)
Implemente una experimentación efectiva en múltiples segmentos de clientes para reducir la rotación y promover la retención.
Enjuague y repita desde el Paso 1 (la gestión cognitiva de la rotación es un proceso continuo y no una vez al año de ejercicio ) .

También creemos que el enfoque de segmentación de análisis de riesgo-toma de decisiones-mercadeo es una estructura suficientemente genérica que Puede usarse para muchos problemas de negocios y no solo para análisis de abandono.

ESPERE, ¿QUÉ ES ESTO REALMENTE?

Un modelo de abandono predictivo es una herramienta de clasificación directa : observe la actividad del usuario desde pasado y verifique quién está activo después de un cierto tiempo y luego cree un modelo que identifique de forma probabilística los pasos y etapas cuando un cliente (o segmento) abandona su servicio o producto.

Tener un modelo de cambio predictivo le da conciencia y Métricas cuantificables contra las que luchar en tus esfuerzos de retención. Esto le da la capacidad de establecer hábitos de los clientes que se van, e intervenir antes de que tomen esa decisión. Sin esta herramienta, estaría actuando en base a supuestos amplios, no a un modelo basado en datos que refleje cómo actúan realmente sus clientes.

Sin una comprensión sólida de sus clientes y sus comportamientos, es difícil retenerlos, por lo que es el primer paso. Crear este modelo es comprender el comportamiento de su cliente desde los puntos de datos del cliente. Veamos qué tipo de datos necesitamos para evaluar los factores desencadenantes que hicieron que finalmente abandonaran su empresa.

Información del cliente

Código postal
Grupo de ingresos
Género [19659013] Ocupación
¿Tienen niños en el hogar?
¿Cómo encuentran su sitio web / producto?
¿Abren sus boletines y otros correos electrónicos de activación o hacen clic en los enlaces?

Productos

Tipo de producto
Variedad de productos
Uso del cupón
Preferencias del producto o Combos

Historial de compras

Frecuencia de compra
Fecha de la última compra
Hora del día / temporada de compra
Valor de las compras
Métodos de pago
Saldos / Crédito de la tienda

Interacciones con el cliente

Preguntas de servicio
Visitas a la tienda / En línea
Resoluciones de la queja [19659013] Prioridad de quejas
¿Cómo se quejan? – em ¿Ail o teléfono o twitter?
Frecuencia de las quejas

Estos son algunos campos de muestra para comenzar y preferimos más. Es importante saber todo lo que podamos sobre nuestros clientes para saber qué evento los lleva a irse y encontrar al próximo competidor. Cuantos más datos relevantes recopile, más preciso será su modelo. Si utiliza modelos de rotación de aprendizaje automático, puede usar más variables de las que es humanamente posible calcular y jugar. Tan pronto como tenga estos datos de clientes variados pero conectados en un solo lugar para poder manipularlos y realizar consultas con facilidad, verá surgir tendencias frente a sus ojos que le brindarán información sobre la rotación de clientes. Los datos consolidados de todos los clientes agitados también lo ayudarán a agrupar comportamientos y establecer patrones.

PREPARACIÓN DE DATOS

Una vez que haya recopilado datos suficientes para su análisis, el siguiente paso es preparación de datos . Este es el paso más importante pero más lento en el análisis de datos. Como dice el famoso adagio- “Garbage In, Garbage Out” . Su análisis será tan bueno como los datos en los que se basa.

Puede usar estos tres criterios para asegurar una buena calidad de datos:

Completo
Limpiar
Preciso

Completo – ¿Tienes todas las dimensiones relevantes? ¿Qué porcentaje de datos tiene valores perdidos o nulos? Puede completar algunos de los valores faltantes por exploración de datos, por ejemplo, valores de “Estado” según la dirección del cliente; ‘Categoría de producto’ basada en el artículo del producto, etc.

Limpiar- ¿Tiene múltiples valores para la misma dimensión? Por ejemplo, CA / Calif / California; Salud / Hospital / Proveedor; abreviaturas diferentes para el nombre de un producto, etc. Si es así, puede hacer una limpieza de datos para asegurar la uniformidad.

Exactitud- ¿Existen valores de ingresos negativos o ingresos de $ 0 para algunas transacciones ?; Conflictos de fecha; Los valores ‘NINGUNO’ o ‘N / A’, etc. Puede decidir, después de discutir con las partes interesadas, si incluir o excluir tales datos erróneos en el análisis.

En el análisis predictivo + de diagnóstico, hay un paso más involucrado preparación de datos – creando la variable objetivo. En caso de un análisis de abandono, podría tratarse de una columna binaria como “se producirá un error?” . Puede completar los valores de esta variable analizando los datos históricos. Por ejemplo, un valor de 1 / VERDADERO para clientes que cancelaron su suscripción y 0 / FALSO para aquellos que renovaron .

ANÁLISIS EXPLORATORIO

el final del artículo para el técnico inclinado *

A diferencia del modelado estadístico tradicional, el algoritmo informático genera los modelos predictivos basados en el aprendizaje automático, a diferencia de los estadísticos basados en su interpretación de los resultados de la regresión lineal y tecnicas Una habilidad crítica para construir el modelo de rotación es poder hacer tantas preguntas como sea posible. De esta manera, puede probar, volver a probar y calificar sus suposiciones y datos antes de pasar a implementar un modelo. Aquí hay algunas preguntas básicas para comenzar.

1. ¿Cuál es el grado de correlación entre los puntos de datos disponibles y el desgaste?

A partir de esta pregunta, es posible encontrar una respuesta como “de todos los clientes que se fueron en el último trimestre, el 80% de ellos presentó una queja durante El fin de semana “, o” de todos los clientes que se fueron en los últimos dos trimestres, el 56% de ellos nunca usaron las herramientas de informes en nuestro software “. Su objetivo es usar esta pregunta exploratoria para resaltar uno o más patrones de correlación en puntos de datos particulares a desgaste. Mientras se encuentra en eso, también haga las mismas preguntas a los clientes actuales y vea si sus suposiciones generales se mantienen verdaderas o son simplemente puntos aleatorios en un diagrama de dispersión: si sus suposiciones son verdaderas, ha descubierto una tendencia que necesita atención, si no la mantiene hacer más preguntas.

El uso de modelos de aprendizaje automático también puede mostrarle algunas correlaciones que generalmente son invisibles para los analistas humanos.

2. ¿En qué etapa del ciclo de vida del producto se fueron?

¿Cuándo se fueron estos clientes? Al final de la primera prueba, cuando la suscripción expiró, o ¿alguna característica fue demasiado difícil de usar o es un evento externo? ¿Cuánto tiempo usaron nuestro software antes de irse? ¿Hicieron una llamada telefónica al servicio al cliente y se quedaron insatisfechos? ¿Cuáles son algunas de las tendencias clave para los clientes que no se fueron y renovaron sus suscripciones?

Continúe explorando todos y cada uno de los puntos de datos y sus proporciones: los modelos de aprendizaje automático generalmente hacen esto mucho mejor que los humanos y encuentran patrones inesperados.

3. ¿Cuál es el impacto en el valor de la vida útil (LTV) de los diferentes segmentos de clientes?

El resultado de un buen modelo es encontrar factores desencadenantes y comportamientos que equivalen a levantar, o aumentar la retención, y disminuir, un aumento de la rotación. Cada uno de sus atributos se puede asignar a un cociente de elevación o caída. Por ejemplo, si cada cliente en un segmento en particular tenía un LTV de $ 100, y su modelo muestra que el número X de ellos se está yendo, entonces puede resaltar fácilmente el impacto negativo en la línea superior debido a esta rotación, ayudando a los líderes de negocios a cuantificar y priorizar sobre estrategias de retención.

LO QUE VIENE A CONTINUACIÓN ..

Esperamos que se agoten con la exploración y que se encuentren algunos patrones interesantes de desgravaciones de clientes. Es posible que también hayas encontrado uno o dos puntos de datos altamente correlacionados, o posiblemente un grupo más grande que no esté tan diferenciado como esperabas.

Si no puedes encontrar al menos tres atributos de alta correlación, no estás preguntando las preguntas correctas de sus datos o quizás no tenga el conjunto de datos correcto para comenzar.

Una vez que haya identificado los segmentos de clientes y sus comportamientos que los llevan a la pérdida, puede hacer recomendaciones para que su equipo aumente la clientela. retencion. El diseño, la implementación y la deducción de los resultados de la experimentación inteligente es un tema de otro artículo, pero aquí hay algunas ideas rápidas.

Para una empresa de telecomunicaciones que experimenta una pérdida de datos demográficos de bajos ingresos que usa más textos que las llamadas telefónicas reales, puede tratarse de crear un ‘plan’ de nicho dirigido a ese segmento para evitar que los usuarios cambien al siguiente proveedor.

Para un servicio de herramienta de administración de proyectos en línea que ve una caída rápida de clientes durante el período de prueba, puede ser ofrecer capacitación explícita sesiones durante la incorporación de nuevos clientes para que el período de prueba sea más atractivo.

IMPLEMENTACIÓN DE MUESTRA (conjunto de datos de Kaggle Telecom)

Para nuestro artículo y para simplificar, asumiremos que los datos están listos para ser incorporados al motor predictivo, y comience con un modelo de regresión lineal simple o un modelo de regresión logística para hacer un análisis exploratorio. El modelo de regresión lineal es útil para averiguar qué conjunto de dimensiones / predictores independientes son buenos para predecir la variable objetivo. También, destacando las variables que tienen una influencia particularmente fuerte.

Aquí hay un modelo de regresión lineal simple en R basado en un conjunto de datos de telecomunicaciones :

lm (Churn ~ International_Plan + Voice_Mail_Plan + Total_Day_charge + Total_Eve_Charge + Total_Night_Charge + Total_Intl_Calls + No_CS_Calls + Total_Intl_Charge, data = telecom)

Churn es la variable dependiente. Las variables independientes están seguidas por el símbolo “~”. “Telecomunicaciones” es el nombre del conjunto de datos utilizado. Puede agregar / eliminar las variables independientes en función de cómo cambie el valor de R2 ajustado: si lo aumenta, es un factor predictivo importante; si disminuye el valor, puede excluirlo.

La salida:

Salida del modelo de regresión lineal en R para el conjunto de datos analizado

Para interpretar qué atributos tienen una gran influencia, observamos el número de asteriscos en el fin. ‘***’ – muy significativo; ‘**’- significativo; ‘*’ Importante; “.” No es tan importante

Vemos que, para una empresa de telecomunicaciones, atributos como “Número de llamadas de servicio al cliente” ; “Ofertas del Plan Internacional” ; Las “tarifas de llamadas internacionales” etc. desempeñan un papel importante en el desgaste del cliente para el conjunto de datos que se está inspeccionando. Desde una perspectiva empresarial, esto requiere una mayor investigación sobre el análisis del mensaje de servicio al cliente y / u ofrecer planes competitivos para mantener la lealtad del cliente.

El uso de un modelo de regresión logística también produce un resultado similar:

glm (Churn ~ International_Plan + Voice_Mail_Plan + Total_Day_charge + Total_Eve_Charge + Total_Night_Charge + Total_Intl_Calls + No_CS_Calls + Total_Intl_Charge +, data: el estado de la red de animales de la ciudad de Estados Unidos El modelo identifica los mismos predictores como fuerte influencia en la variable ‘Churn’. Cuando calculamos la precisión del modelo usando una matriz de confusión resulta ser 86.3%.

Precisión = (Negativos verdaderos + Positivos verdaderos) / Registros totales

0.8632 = (2773 + 104) / 3333

El modelo ahora está listo para ser implementado en los datos de prueba. En caso de regresión logística, esto se realiza mediante la función predict () :

predict (telecomLog, type = “response”, newdata = telecomTest)

where

‘telecomLog’ es el modelo de regresión logística.

‘telecomTest’ es un conjunto de datos de prueba.

“respuesta” le dice al motor predictivo que produzca el resultado es en términos de probabilidades, lo que en nuestro caso tiene sentido, ya que queremos saber cuál los clientes tienen una alta probabilidad de abandono.

La visualización de la información de Tableau derivada de la implementación del Modelo de Regresión Logística en R. Los gráficos resaltan una correlación positiva entre no. de llamadas al servicio al cliente y probabilidad de abandono, así como una mayor influencia de correlación de planes internacionales y abandono.

Ahora que hemos hecho un análisis exploratorio y hemos tenido una idea de las variables con influencia, podemos sumergirnos en un enfoque basado en el modelo de conjunto . En la actualidad, los científicos de datos están utilizando un modelo múltiple o un enfoque conjunto para abordar problemas empresariales complejos en el análisis predictivo, como la rotación de clientes. En este enfoque, se usan dos o más algoritmos en el mismo conjunto de datos y los resultados se comparan para obtener más precisión y evitar el sobreajuste.

*Modelado de conjuntos en Microsoft Azure Machine Learning*

Aquí hemos utilizado Microsoft Azure Machine Learning para predecir la rotación en el conjunto de datos de Kaggle de telecomunicaciones usando dos algoritmos: Árbol de decisión reforzado y regresión logística.

La mayor precisión del enfoque de modelado por conjuntos reduce la tasa de errores de clasificación [194591099] [194590109] la tasa de error general .

La tasa de error de clasificación es la cantidad de clientes identificados como de alto riesgo, en realidad no no churn. Esto podría ahorrar una gran cantidad de dinero a las empresas al evitar el envío de promociones / paquetes especiales a los vendedores de bajo riesgo y centrarse en la intervención de los de alto riesgo. Aquí está la comparación de precisión del modelo conjunto:

Las curvas ROC de los árboles de decisión impulsados y los modelos de regresión logística

Comparando el valor AUC (Área bajo la curva) para ambos modelos, vemos que el aumento de dos clases El árbol de decisión se desempeña mejor que el modelo de regresión logística tradicional para identificar errores de clasificación. La tasa de clasificación errónea del modelo Boosted Decision Tree es inferior al 5%, mientras que la del modelo Regresión logística es del 16%. Por lo tanto, con un enfoque conjunto, podemos capitalizar los puntos fuertes de ambos modelos: el modelo de regresión logística identifica los predictores que tienen una fuerte influencia en la variable de destino, mientras que el Árbol de decisión impulsado identifica con mayor precisión a las empresas de alto riesgo.

En conclusión, un enfoque holístico para predecir fenómenos de negocios complejos sería una buena combinación de modelos estadísticos tradicionales y metodologías de futuro como Modelado de conjunto.

EN EL FINAL …

Si realmente desea tomar decisiones de alta calidad, centradas en el riesgo y centradas en el cliente que deben basarse en conclusiones sobre el mundo más allá de los datos disponibles, necesitará científicos de decisión. e ingenieros en su equipo. La gestión de turnos es esencial para cualquier negocio y los algoritmos basados en aprendizaje automático lo hacen mucho más preciso.