El Drift de los Retornos y su Impacto en el Alpha Decay

En esta ocasión, tenemos el honor de contar con un artículo de Jaume Antolí Plaza. Para los que no le conozcáis, Jaume es un trader algorítmico y científico de datos que quedó en 2ª posición en la última edición de Robotrader, utilizando para ello un enfoque basado en minería de datos para la extracción de reglas de trading.

Actualmente Jaume forma parte de Quantdemy y colabora con Quantified Models impartiendo Pytrading: Python & ML Ignition, una excelente formación con sesiones en directo de Python aplicado al trading algorítmico. Por cierto, si os interesa este curso, me han dado un código de descuento del 10% en exclusiva para los lectores de X-Trader, es el siguiente: XTRADER10PML

Hechas las presentaciones, ¡vamos al lío con Jaume!


Si hace unos años me hubieran concedido 3 deseos en el ámbito del trading, habría pedido los siguientes:

1) Dedicarme al trading ✅
2) Ganar Robotrader ✅
3) Escribir en X-Trader (aquí estamos)

¡Vamos a ello!

DEL DRIFT AL ALPHA DECAY: REVISANDO LA PARTICIÓN TRAIN / TEST

Como traders, perseguimos la robustez en nuestras estrategias, anhelando que resistan el paso del tiempo y las fluctuaciones del mercado. Sin embargo, nos enfrentamos a una realidad desalentadora: el alpha decay, ese inexorable deterioro del rendimiento.

Ante el alpha decay, nos vemos obligados a tomar medidas: reentrenar modelos, reoptimizar parámetros o, en el peor de los casos, desactivar estrategias. Pero, ¿cuántas veces nos detenemos a pensar en las causas del alpha decay que minan la eficacia de nuestras estrategias de trading?

Este artículo profundiza en estas cuestiones, explorando la relación entre el drift de los retornos de un activo y el alpha decay de una estrategia. Además, desafiamos la convención de la clásica partición train / test con el objetivo de preservar el rendimiento de nuestras estrategias.

¿QUÉ ES EL DRIFT DE LOS RETORNOS?

La distribución de los retornos de un activo no se mantiene constante: durante una tendencia alcista la media de los retornos será positiva y durante una tendencia bajista la media de los retornos será negativa.

Además de la media, varía la volatilidad: en periodos de alta volatilidad se producen retornos extremos pero en periodos de baja volatilidad los retornos se concentran cerca de la media.

A modo de ejemplo, en el siguiente gráfico mostramos la evolución del EURUSD en el periodo 2017-2018.

1. EURUSD (2017-2018)
Fig. 1: EURUSD (2017-2018)

Observamos que el 2017 fue alcista y el 2018 fue bajista, lo que se traducirá en distribuciones de retornos diferentes.

2. RETORNOS 2017 VS RETORNOS 2018
Fig. 2: Retornos 2017 vs retornos 2018

Esta diferencia entre la distribución de retornos de un periodo respecto a la de otro periodo es a lo que llamamos drift de los retornos.

EL IMPACTO DEL DRIFT EN EL ALPHA DECAY

Una estrategia de trading puede ser vista como una ecuación: tenemos unas variables independientes (indicadores técnicos, datos fundamentales o información macroeconómica) que usamos para descifrar una variable dependiente (retornos).

Si las características de estas variables y las relaciones entre ellas permanecieran constantes, la estrategia mantendría su rendimiento a lo largo del tiempo. Sin embargo, los datos financieros son dinámicos: la misma señal, por ejemplo cruzar al alza el nivel de sobreventa del RSI, puede indicar continuidad de la tendencia en un momento y reversión en otro.

3. CONTINUIDAD VS REVERSIÓN
Fig. 3: Continuidad vs reversión

En el trading, debido al drift inherente a los datos financieros, la estrategia se enfrentará a un periodo futuro con características diferentes a las del periodo en el que fue entrenada u optimizada, lo que provocará alpha decay.

CUANTIFICANDO EL DRIFT

Para cuantificar el drift de los retornos tenemos que comparar la distribución de retornos de un periodo respecto a la de otro periodo y para hacerlo utilizamos el test de Kolmogorov-Smirnov, que en Python es una línea:

4. TEST DE KOLMOGOROV-SMIRNOV
Fig. 4: Test de Kolmogorov-Smirnov con Python

El valor p es una métrica que oscila entre 0 y 1: si las dos distribuciones son idénticas, el valor p es 1 y cuanto más diferentes sean las muestras, más cercano a 0 será el valor p.

Por tanto, podemos considerar el valor p como una métrica de la similitud entre dos distribuciones.

En el ejemplo anterior hemos comparado los retornos del 2017 del EURUSD contra los del 2018 obteniendo un valor p de 0.24, lo cual nos indica que las muestras están lejos de ser idénticas.

NATURALEZA DEL DRIFT EN FOREX

La evolución del drift y el consecuente alpha decay es algo que los traders experimentan continuamente: unos buenos resultados en el periodo de entrenamiento se convierten en unos peores resultados en el periodo de test y aún en peores resultados en real.

5. EVOLUCIÓN DEL RENDIMIENTO
Fig. 5: Evolución del rendimiento

De manera intuitiva, por nuestra experiencia como traders, podríamos concluir que cuanto más nos alejamos del periodo de entrenamiento, peores resultados obtenemos.

Disponiendo de una manera de cuantificar el drift, podemos estudiar cómo evoluciona en Forex. Para ello, consideraremos un período de 10 años, desde el 01-01-2012 hasta el 01-01-2022 y definiremos 2 períodos:

  • Ventana fija de 2 años: desde el 01-01-2020 hasta el 01-01-2022
  • Ventana móvil de 2 años: desde el 01-01-2012

El resultado agregado del valor p del test de Kolmogorov-Smirnov para los 28 principales pares de Forex es el siguiente:

6. EVOLUCIÓN DEL DRIFT
Fig. 6: Evolución del drift

A lo largo de los años, a pesar de las fluctuaciones, es evidente que la ventana móvil se asemeja cada vez más a la ventana fija a medida que los 2 períodos se acercan. Esto es debido a la naturaleza progresiva del drift en Forex: los cambios en los datos se producen de manera gradual. Cuanto más se alejen los 2 períodos, menos se parecerán y cuanto más se acerquen, mayor será su similitud.

ALPHA DECAY Y VIGENCIA DE UNA ESTRATEGIA

Dejadme que lo diga alto y claro porque es trascendental en Forex: el futuro inmediato es más probable que se parezca al pasado reciente que al pasado lejano.

7. AFORISMO DEL FUTURO INMEDIATO
Fig. 7: Aforismo del futuro inmediato

En este contexto, es crucial comprender que el momento de mayor rendimiento de una estrategia ocurre justo después del período de entrenamiento, cuando aún no ha sufrido alpha decay. Si introducimos un período de test antes de implementar la estrategia en real, estamos sacrificando parte de su “frescura”.

Por esta razón, propongo una técnica a la que denomino “partición invertida”. En esta metodología, se altera el orden tradicional de los períodos de entrenamiento y test: el período de entrenamiento se sitúa más cerca de las condiciones reales, mientras que el período de test se ubica más alejado en el tiempo.

8. PARTICIÓN CLÁSICA VS PARTICIÓN INVERTIDA
Fig. 8: Partición clásica vs partición invertida

EVIDENCIA EMPÍRICA DE LA PARTICIÓN INVERTIDA

Partiendo de la experiencia común entre los traders del alpha decay, donde se observa peores resultados en test que en train y aún peores resultados en real, hemos dado explicación al origen del alpha decay debido a la naturaleza progresiva del drift de los retornos. Hemos llegado a la conclusión de que “el futuro inmediato es más probable que se parezca al pasado reciente que al pasado lejano”. Esta observación nos lleva a sugerir que sería más adecuado entrenar con los datos más recientes, dando lugar a la técnica de la “partición invertida”.

A continuación, vamos a presentar evidencia empírica que respalda esta afirmación, demostrando que el entrenamiento con datos más recientes puede resultar en un mejor rendimiento en real.

Para llevar a cabo nuestro análisis, utilizaremos un conjunto de datos que abarca 9 años, desde el 01-01-2015 hasta el 01-01-2024. Dentro de este marco temporal, definiremos los siguientes períodos:

  • Entrenamiento clásico: desde el 01-01-2015 al 01-01-2020.
  • Entrenamiento invertido: desde el 01-01-2020 al 01-01-2023.
  • Forward: desde el 01-01-2023 al 01-01-2024.
9. PARTICIONES VS FORWARD
Fig. 9: Particiones vs forward

Nuestro objetivo es calcular el valor p del test de Kolmogorov-Smirnov para los 28 pares principales de Forex, tanto para el período “Entrenamiento clásico” como para el de “Entrenamiento invertido”, en relación con el período “Forward”. A continuación, presentaremos un boxplot para comparar los resultados agregados obtenidos en estos períodos de entrenamiento. Este análisis nos permitirá demostrar empíricamente la eficacia de la técnica de la “partición invertida”.

10. BOXPLOT CLÁSICA VS INVERTIDA
Fig. 10: Boxplot clásica vs invertida

Como se puede observar, tanto el valor de la mediana como del rango intercuartílico de la “partición invertida” es notablemente mayor que para la partición clásica. Esto respalda la afirmación de que el “el futuro inmediato es más probable que se parezca al pasado reciente que al pasado lejano”, y por tanto, es más adecuado entrenar con los datos más recientes.

Por si queda alguna duda, a continuación se muestra un diagrama circular que representa el porcentaje de veces que el “entrenamiento invertido” es más parecido al “forward” que el “entrenamiento clásico”:

11. PIE CHART CLÁSICA VS INVERTIDA
Fig. 11: Pie chart clásica vs invertida

En el 75% de los 28 principales pares de Forex, el “entrenamiento invertido” es más similar al “forward” que el “entrenamiento clásico”.

RESUMEN Y CONCLUSIONES

En resumen, a través de este artículo, hemos explorado la naturaleza progresiva del drift de los retornos y su impacto en el alpha decay. Hemos introducido la técnica de la “partición invertida” como un enfoque prometedor para mitigar este problema, basándonos en la premisa de que “el futuro inmediato es más probable que se parezca al pasado reciente que al pasado lejano”.

Nuestro análisis empírico, respaldado por los resultados gráficos mostrados, ha comprobado que la “partición invertida” obtiene un período de entrenamiento más similar al “forward” del que se obtiene con la partición clásica. La razón de esto radica en la naturaleza misma de los algoritmos de trading. Estos algoritmos se entrenan para identificar patrones en los datos históricos y luego aplicar este conocimiento para predecir los movimientos futuros del mercado. Si los datos más recientes son más similares al futuro inmediato, entonces tiene sentido que un algoritmo entrenado en estos datos esté mejor preparado para predecir con mayor precisión estos movimientos futuros.

Además, el concepto de alpha decay también respalda esta idea. Como hemos discutido, el alpha decay se refiere a la disminución del rendimiento de una estrategia de trading con el tiempo. Si una estrategia se entrena con datos más antiguos, es probable que su rendimiento disminuya más rápidamente debido a los cambios en el mercado que han ocurrido desde entonces. Por otro lado, una estrategia entrenada con datos más recientes estará más en sintonía con las condiciones actuales del mercado, lo que podría resultar en un alpha decay más lento y, por tanto, en un rendimiento superior en el futuro inmediato.

SPOILER

TO BE CONTINUED…

En la siguiente entrega, extraemos reglas de trading con minería de datos para comprobar si las obtenidas aplicando “partición invertida” obtienen mejores resultados que las obtenidas con la clásica partición y compartimos el código en Python.

Jaume Antolí Plaza
@jantolip

¿Aún no programas en Python?


No te lo pienses más: apúntate a Pytrading: Python & ML Ignition, la formación impartida por Jaume Antolí Plaza.
Ah, y recuerda que, por ser lector de X-Trader.net, tienes un cupón de descuento exclusivo del 10%. Apúntalo, es el siguiente: XTRADER10PML

COMPARTIR EN: