Los practicantes de Financial Machine Learning han estado usando los candeleros incorrectos: ¿aqui el por que?

En este artículo, exploraremos por qué las velas tradicionales basadas en el tiempo son un método ineficiente para agregar datos de precios.

Especialmente en dos situaciones:

  • Mercados altamente volátiles como las criptomonedas
  • Cuando se utiliza la negociación algorítmica o automática. Para demostrar este punto, analizaremos el comportamiento del precio histórico de Bitcoin-USD.

Veremos por qué los mercados ya no siguen los ciclos de la luz solar y por qué el tipo de datos que utilizamos puede ser una ventaja con respecto a los competidores.

Finalmente, presentaremos brevemente métodos alternativos y modernos de agregación de precios. Como las barras de desequilibrio de volumen o marca. Que apuntan a mitigar las deficiencias de las velas tradicionales.

Sobremuestreo y submuestreo en altamente volátil mercados

Los mercados de criptomoneda son extremadamente volátiles. Los precios cambian rápidamente y es bastante común ver que el precio se mueve lateralmente durante horas antes de ser bombeado o vaciado 5-20% en cuestión de minutos.

Si bien las estrategias de negociación a largo plazo pueden seguir siendo rentables mientras se ignora la volatilidad intradía. Cualquier estrategia a medio o corto plazo (sin mencionar las transacciones de alta frecuencia) necesariamente tendrá que abordar el problema de la volatilidad de una forma u otra.

En el siguiente gráfico, analizamos la volatilidad del par Bitcoin-dólar desde marzo de 2013 hasta abril de 2019 para el intercambio de Bitfinex (datos obtenidos de CryptoDatum.io ) usando candelabros de 5 minutos.

Específicamente, mostramos:
  1. el histograma de cambios de precios absolutos (calculado como porcentaje de cambio del precio de cierre respecto del precio de apertura).
  2. la proporción de velas a la derecha del histograma desde un punto específico (línea roja) y
  3. Proporción de la cantidad total de cambio de precio producido por las velas a la derecha (línea verde).
Por lo tanto, podemos observar que:
  1. La mayoría de las velas de 5 minutos (alrededor del 70%) experimentan los cambios en los precios por debajo del 0.25%, y la mayor parte de ellos prácticamente no experimentan cambios en los precios (el primer pico del histograma fue de 0.00 a 0.05%).
  2. El 20% (0.2049) de las velas explican casi el 67% (0.6668) del monto total del cambio de precio.
  3. El 2% de los candelabros explica el 21% del monto total del cambio de precio, lo que indica que en el 2% de los candelabros BTC-USD se produjeron enormes variaciones de precios en el corto período de tiempo de 5 minutos (alta volatilidad ).

Lo que podemos concluir a partir del punto 1 es que las velas basadas en el tiempo períodos de muestra clara de baja actividad (actividad entendida como cambio de precio).

En otras palabras, en el 70% de los candelabros no ocurre nada. Por lo que la pregunta es: si queremos entrenar un algoritmo basado en ML.

¿Necesitamos todas estas velas donde no se observa ningún cambio? ¿Sería útil encontrar una manera de eliminar o descartar la mayoría de las velas sin sentido para enriquecer nuestros conjuntos de datos?

Por otra parte, los candelabros basados ​​en el tiempo superponen los períodos de baja actividad y los períodos de alta actividad debajo de la muestra

Por otro lado, los puntos 2 y 3 indican que la mayoría de los cambios de precios ocurren en un pequeño porcentaje de candelabros. Lo que sugiere que candelabros basados ​​en el tiempo no alcanzan los períodos de alta actividad .

Lo que esto significa es que si el precio cambia un 10% en 5 minutos y estamos usando candelabros de 5 minutos. Nuestro algoritmo no podrá ver nada entre la apertura y el cierre del candelabro basado en el tiempo. Posiblemente faltando un buen oportunidad comercial.

Por lo tanto, idealmente, nos gustaría encontrar una manera de probar más velas cuando la actividad del mercado aumenta y muestrear menos velas cuando la actividad del mercado disminuye.

Es probable que los mercados ya no sigan los ciclos de la luz humana

La razón principal por la que estamos usando Los candeleros basados ​​en el tiempo se deben a que los humanos vivimos incrustados en el tiempo. Por lo tanto, el tiempo es algo que consideramos tremendamente conveniente para organizarnos y sincronizar nuestros ritmos biológicos.

Además, el ciclo de la luz solar es de suma importancia para los seres humanos porque determina el ciclo de sueño despierto. Que es de importancia biológica para nuestra supervivencia.

Como consecuencia del ciclo de la luz del día. Las bolsas de valores tradicionales abren a las 9:30 AM (para que los humanos reales puedan comerciar mientras están despiertos) y cierran a las 4 PM (para que los comerciantes pueden dormir en paz, pero … ¿lo hacen?).

Con el advenimiento de la tecnología, los robots de negociación automática han comenzado a desplazar a los verdaderos comerciantes humanos y, especialmente en las criptomonedas. Los mercados ya no siguen el ciclo de la luz del día ya que permanecen abiertos 24 / 7.

En estas circunstancias, ¿tiene sentido seguir utilizando las velas basadas en el tiempo, una mera norma, consecuencia de la conveniencia humana?. López de Prado, lo resume bien en su libro Avances in Financial Machine Learning :

Aunque las barras de tiempo son quizás las más populares entre los profesionales y académicos, deben evitarse. […] Los mercados no procesan información en un intervalo de tiempo constante. […] Como seres biológicos, tiene sentido que los humanos organicen su día de acuerdo con el ciclo de la luz solar. Pero los mercados actuales son operados por algoritmos que operan con supervisión humana flexible, para los cuales los ciclos de procesamiento de la CPU son mucho más relevantes que los intervalos cronológicos

Los datos de todos no son una ventaja para nadie

La razón por la que la mayoría de los algoritmos de negociación son un secreto bien guardado es porque el dinero se hace cuando desde una situación fuera de equilibrio podemos anticipar que vamos a otro equilibrio.

Y, en términos generales, el equilibrio significa que todos ya están conscientes de lo que está sucediendo y hay suficientes fuerzas positivas y negativas para mantener en equilibrio el equilibrio recién alcanzado.

Para anticipar un cambio en el equilibrio debemos ser contrarios y correctos en Al mismo tiempo: esto es, debemos saber algo que el resto no sabe y ser correctos en nuestra afirmación.

Debemos encontrar fuera de los equilibrios que la mayoría de los otros operadores desconocen, de lo contrario ya estaríamos en equilibrio nuevamente. A menudo se lo denomina juego de “suma cero”, aunque no me gusta especialmente esta definición.

Los datos de todos no son una ventaja para nadie

Para ser contrarios, debemos mirar los datos y analizarlos En nuevas formas creativas que nos permiten obtener una cierta ventaja, respetar a los demás. Aquí es cuando pequeños detalles como el tipo de datos que usamos para entrenar nuestros algoritmos pueden hacer una gran diferencia.

En la práctica, esto significa que si todos usamos velas basadas en el tiempo, ¿por qué usaríamos lo mismo que todos los demás? Si pudiera existir una alternativa minoritaria, mejor, ¿por qué seguiríamos usando las velas basadas en el tiempo?

Las velas alternativas

Pocas veces me sentí más iluminado que después de leer los primeros capítulos del libro de de Prado Advances in Financial Aprendizaje automático . En su libro, este administrador de fondos experimentado revela prácticas comunes y herramientas matemáticas que ha estado utilizando para administrar fondos multimillonarios durante más de 20 años.

Particularmente, sabe de primera mano que el comportamiento de los mercados ha cambiado drásticamente a lo largo de los años y que competir con los robots comerciales es más una regla que una excepción.

En este contexto, de Prado describe una serie de tipos alternativos de candelabros que tienen como objetivo reemplazar los candelabros tradicionales basados ​​en el tiempo y que aportan la creatividad y la novedad necesarias al espacio financiero.

A continuación, se incluyen algunos ejemplos de candelabros o barras alternativas propuestas. por de Prado:

  • Barras de ticks : muestreamos una barra cada vez que tiene lugar un número predefinido de transacciones, es decir, transacciones. Por ejemplo, cada vez que se realizan 200 transacciones en el intercambio, muestreamos una barra OHLCV calculando sus valores de Volumen alto-bajo-bajo-cerrado.
  • Barras de volumen : muestreamos una barra cada vez Se intercambia un volumen predefinido. Por ejemplo, creamos una barra cada vez que se intercambian 10 Bitcoins en un intercambio.
  • Barras de desequilibrio de garrapatas : Analizamos qué desequilibrado es la secuencia de intercambios y muestreamos una barra cada vez que el desequilibrio supera nuestro expectativas.

En publicaciones futuras analizaré cada una de las velas alternativas descritas en el libro. Veremos cómo construirlos, compararemos sus propiedades estadísticas, como la normalidad y la correlación en serie, con los candeleros tradicionales y analizaremos cómo estas barras superan exactamente las deficiencias de los candeleros tradicionales.

Gracias por leer, más contenido está por llegar, así que estad atentos.

¿Te gustaría probar los bares alternativos que mencionamos en el artículo? En CryptoDatum.io nos esforzamos por ofrecer los últimos conjuntos de datos de criptomoneda para conectar sus propios algoritmos de negociación basados ​​en ML. Visítenos en https://cryptodatum.io .

La información proporcionada es solo para fines educativos. De ninguna manera representa ningún consejo financiero y la información debe tomarse “tal cual” sin garantía de ningún tipo.


Los practicantes de Financial Machine Learning han estado utilizando los candeleros incorrectos: aquí se explica por qué se publicó originalmente en Hacia la ciencia de datos en Medium, donde las personas continúan la conversación resaltando y respondiendo a esta historia.

Dejá un comentario