Aprendizaje automático en finanzas: por qué no debe usar LSTM para predecir el mercado de valores

Recientemente ha habido mucho desarrollo e interés en el aprendizaje automático, con los resultados más prometedores en reconocimiento de voz e imagen. Este trabajo de investigación analiza el rendimiento de un método de aprendizaje profundo, redes neuronales de memoria a largo plazo a largo plazo (LSTM), aplicado al mercado de valores de EE. UU. Representado por el S&P 500. El documento muestra que, si bien esta técnica puede haber tenido un gran éxito en otros campos, como el reconocimiento de voz, no funcionan tan bien cuando se aplican a datos financieros. De hecho, se caracterizan por una alta relación ruido / señal, lo que dificulta que un modelo de aprendizaje automático encuentre patrones y prediga precios futuros.

Este artículo de investigación está estructurado de la siguiente manera. La primera sección presenta LSTM y por qué se pueden aplicar a las series de tiempo financieras. La segunda sección analiza el rendimiento de un LSTM aplicado al S&P 500. La tercera sección concluye.

1. ¿Qué es un LSTM?

Las redes neuronales de memoria a largo plazo (LSTM) son un tipo particular de modelo de aprendizaje profundo. En particular, es un tipo de red neuronal recurrente que puede aprender las dependencias a largo plazo de los datos, por lo que generalmente se usa para predicciones de series de tiempo.

La figura 1 muestra la arquitectura de una capa LSTM.

1 Capa LSTM de arquitectura

Como muestra la figura, se compone de un módulo central de repetición. Esta estructura hace que la LSTM sea capaz de aprender dependencias a largo plazo. El primer bloque LSTM toma el estado inicial de la red y el primer paso de la secuencia X (1), y calcula la primera salida h (1) y el estado de celda actualizado c (1). En el paso de tiempo t, el bloque toma el estado actual de la red (c (t − 1), h (t − 1)) y el siguiente paso de tiempo de la secuencia X (t), y calcula la salida ht y la actualización estado de celda ct.

Figura 2 Arquitectura Bloque LSTM

La ​​Figura 2 muestra la arquitectura de un bloque LSTM, que se compone de 4 componentes principales:

  • Puerta de entrada : controla el nivel de actualización del estado de la celda
  • Olvídese de la puerta : controla el nivel de restablecimiento del estado de la celda
  • Celular candidato : agrega información al estado de la celda
  • Salida de la puerta : controla el nivel del estado de la celda agregado a La puerta oculta.

Para aprender las características de la tarea modelada y poder predecir, se debe capacitar a un LSTM. Este proceso consiste en calcular los pesos y sesgos de la LSTM minimizando una función objetivo, normalmente RMSE, a través de algunos algoritmos de optimización. Una vez que el modelo se entrena en un conjunto de datos de entrenamiento inicial y se valida en un conjunto de validación, luego se prueba en una prueba real de muestras. Esto garantiza que el modelo, de hecho, aprendió características útiles y no está excesivamente equipado en el conjunto de entrenamiento, con capacidades de predicción deficientes en los nuevos datos. La siguiente sección analiza el rendimiento de un LSTM aplicado al S&P 500.

2. Rendimiento LSTM aplicado al mercado de valores de EE. UU.

El conjunto de datos usado se compone de precios diarios de cierre para el mercado de valores de EE. UU., Como lo representa el S&P 500, desde el 3 de enero de 1950 hasta el 4 de enero de 2019, por un total de 17,364 observaciones Los datos se dividen en 60% para entrenamiento, 20% para validación y 20% para pruebas.

La Figura 3 muestra los datos utilizados para el análisis en una escala de registro.

Figura 3 S&P 500 precios cerrados (escala de registro )

En nuestro análisis, entrenamos una red neuronal LSTM compuesta por 1 capa oculta, 20 neuronas y una longitud de serie de 20 valores. Probamos diferentes combinaciones para los parámetros y arquitecturas de la red neuronal y encontramos resultados similares.

La Figura 4 muestra los precios reales en comparación con los valores del día siguiente pronosticados por el LSTM capacitado.

Figura 4 LSTM predicho frente al precio real del S&P 500 (escala de registro)

Como se puede ver en la figura, los valores pronosticados están muy cerca de los precios reales, por lo que el precio real subyacente no se puede ver correctamente. Por lo tanto, puede parecer que el LSTM hace un buen trabajo al predecir el siguiente valor para la serie de tiempo considerada.

La Tabla 1 muestra las estadísticas de rendimiento de la precisión del LSTM al predecir el precio al día siguiente.

Tabla 1 LSTM estadísticas de precisión de predicción

Este dato corrobora lo que podemos ver en la Figura 4. Los valores bajos en RMSE y los valores decentes en R2 muestran que el LSTM puede ser bueno para predecir los siguientes valores para la serie de tiempo en consideración.

Figura 5 muestra una muestra de 100 precios reales en comparación con los pronosticados, desde el 13 de agosto de 2018 hasta el 4 de enero de 2019.

Figura 5 LSTM predicho frente al precio de S&P 500 por 100 días

Esta cifra nos lleva a una conclusión diferente. Si bien, en conjunto, parece que la LSTM es efectiva para predecir los valores del día siguiente, en realidad la predicción hecha para el día siguiente está muy cerca del valor real del día anterior. Esto se puede ver aún más en la Figura 6, que muestra los precios reales rezagados en 1 día en comparación con el precio predicho.

Figura 6 Predice LSTM versus precio S&P 500 rezagado de 1 día durante 100 días

Como muestra la figura, Las 2 series son casi idénticas, lo que confirma nuestras conclusiones anteriores.

Estos resultados demuestran que LSTM no puede predecir el valor para el día siguiente en el mercado de valores. De hecho, la mejor suposición que puede hacer el modelo es un valor casi idéntico al precio del día actual.

3. Conclusión

Si bien es cierto que los nuevos algoritmos de aprendizaje automático, en particular el aprendizaje profundo, han tenido bastante éxito en diferentes áreas, no son capaces de predecir el mercado de valores de EE. UU. Como lo demuestran los análisis anteriores, LSTM solo usa un valor muy cercano al precio de cierre del día anterior como predicción para el valor del día siguiente. Esto es lo que esperaría un modelo que no tiene capacidad predictiva.

Esto también resalta que si bien algunas técnicas de aprendizaje automático pueden ser útiles en finanzas, los fondos de cobertura cuantitativos deben tomar otra ruta y estrategias capaces de ofrecer alfa para sus clientes.

Si desea obtener más información sobre nuestros productos de inversión, envíenos un correo electrónico a info@blueskycapitalmanagement.com o complete nuestra solicitud de información Formulario.

Publicado originalmente en Bluesky Capital .

Descargo de responsabilidad

Este artículo está destinado a fines académicos y educativos y no constituye una recomendación de inversión. La información que proporcionamos o que se deriva de nuestro sitio web no debe ser un sustituto del asesoramiento de un profesional de inversiones. Los modelos hipotéticos discutidos en este documento no reflejan el rendimiento de la inversión de ningún producto o estrategia real en existencia durante los periodos probados y no hay garantía de que si tal producto o estrategia existiera hubiera mostrado características de rendimiento similares. La decisión de invertir en cualquier producto o estrategia no debe basarse en la información o conclusiones contenidas en este documento. Esta no es una oferta de venta ni una solicitud de una oferta para comprar intereses en valores.


Aprendizaje automático en finanzas: por qué no debe usar LSTM para predecir el mercado de valores se publicó originalmente en Hacia datos Science en Medium, donde las personas continúan la conversación resaltando y respondiendo a esta historia.

Dejá un comentario