---
title: Cómo Saber si una Estrategia de Trading Está Sobreoptimizada
date: 2026-03-06T15:56:14Z
modified: 2026-03-08T20:03:31Z
permalink: "https://www.x-trader.net/como-saber-si-una-estrategia-de-trading-esta-sobreoptimizada/"
type: post
status: publish
excerpt: Jaume Antolí, ganador de Robotrader y creador de RuleExtraction.com, nos explica cómo usar datos sintéticos para medir la sobreoptimización de una estrategia.
wpid: 14496
categories:
  - Sin categoría
featured_image: "https://www.x-trader.net/wp-content/uploads/2026/03/Overfitting.jpg"
featured_image_alt: Overfitting
author: Jaume Antolí Plaza
---

_Jaume Antolí, ganador de Robotrader y creador de [RuleExtraction.com](https://ruleextraction.com/), nos explica en este artículo cómo usar datos sintéticos para medir la sobreoptimización y realizar una mejor estimación del rendimiento de la estrategia de trading._

Todo trader algorítmico lo ha vivido alguna vez: una estrategia con un backtest precioso que se convierte en un desastre en real.

No es mala suerte, es sobreoptimización y es un problema estructural del trading algorítmico.

![Representación gráfica del problema de la sobreoptimización](https://www.x-trader.net/wp-content/uploads/2026/03/FIG_1-1024x683.png)

Representación gráfica del problema de la sobreoptimización

## **El Problema del Camino Único**

Cuando backtesteas una estrategia sobre un histórico obtienes un resultado y toda la inferencia que haces sobre el rendimiento de esa estrategia descansa sobre esa única muestra.

En cualquier otro campo científico esto sería inaceptable: no se valida un medicamento con un único paciente porque el resultado no sería estadísticamente significativo. Necesitas una muestra amplia de pacientes para que emerja el efecto real del medicamento.

Sin embargo, en Trading solemos pretender inferir el rendimiento de una estrategia a partir de un único backtest y después nos sorprendemos cuando en real no se parece al backtest.

El problema tiene un nombre: dependencia de un único camino.

El histórico sobre el que se realiza el backtest es solo uno de los infinitos caminos que podría haber tomado ese activo, pero podría haber sido diferente por un tweet de Trump, por un dato macro, por un misil…

En cada uno de esos escenarios distintos, todos tan plausibles como el original, tu estrategia habría obtenido un resultado diferente, pero cuando hacemos un backtest solo vemos uno de esos caminos y con un único backtest no tenemos manera de saber si los resultados de nuestra estrategia se deben a que se ha ajustado demasiado a ese camino en concreto.

## **El Paralelismo con los Ensamblados de Machine Learning**

Este problema no es exclusivo del trading. En Machine Learning es bien conocido que un único modelo es un estimador que tiende a ser poco fiable, por eso se obtienen mejores resultados con el consenso de varios estimadores.

Eso es exactamente lo que hace Random Forest: un único árbol sobreajusta, el consenso de muchos árboles genera una mejor estimación.

Al fin y al cabo, un backtest es un estimador del rendimiento de una estrategia y como cualquier estimador único, es poco fiable.

¿No sería fantástico disponer de varios estimadores del rendimiento de nuestra estrategia en vez de un único backtest?

## **Las Métricas no Resuelven el Problema**

La respuesta habitual de la industria al problema de la sobreoptimización ha sido refinar las métricas con propuestas brillantes como la de Marcos López de Prado con la formulación del Probabilistic Sharpe Ratio, que corrige analíticamente algunas de las asunciones erróneas del Sharpe original.

En mi caso, desarrollé el [Monkey Test Score](https://www.x-trader.net/monkey-test-desafiando-al-azar-en-el-trading-algoritmico/), una métrica que separa el alfa genuino de una estrategia del beta del activo en el que opera comparando el rendimiento de la estrategia contra el de N estrategias aleatorias con las mismas características estructurales.

Estas métricas mejoran a las métricas de backtest habituales, pero comparten el mismo problema de fondo: son resultados que provienen de un único camino y si la estrategia está sobreajustada a ese camino en concreto, el PSR, el MTS y cualquier métrica obtenida en base a ese único camino será poco fiable.

Algunos pensarán que este problema ya está resuelto: Monte Carlo, hacer bootstrapping de los retornos de la estrategia y generar miles de secuencias alternativas; Walk-Forward divide un histórico para acumular múltiples periodos de test.

Sin duda, tanto Monte Carlo como Walk-Forward son mejores que un único backtest pero no escapan realmente del camino único: trabajan sobre un único histórico.

Es como si un extraterrestre quisiera hacer un estudio de la morfología de un humano y para ello hace 1000 fotos del mismo humano: 1000 fotos de 1 humano son mejor que 1 foto de 1 humano, pero 1 foto de 1000 humanos diferentes sería significativamente mejor para hacerse una idea sobre cómo son los humanos.

En nuestro caso, diferentes vistas sobre el mismo histórico es mejor que una única vista, pero lo ideal sería disponer de vistas sobre diferentes históricos.

## **La Solución: Datos Sintéticos**

Si el problema es que solo tenemos un histórico, la solución pasa por generar versiones alternativas del histórico original que sean estadísticamente plausibles y testear la estrategia contra cada uno de esos históricos.

![Multiversos sintéticos](https://www.x-trader.net/wp-content/uploads/2026/03/FIG_2-1024x680.png)

Multiversos sintéticos

El resultado es una distribución de resultados en vez de un único resultado y a partir de esa distribución ya puedes inferir el rendimiento de la estrategia con significancia estadística.

Ahora bien, no vale cualquier sintética: si queremos comprobar la eficacia de un medicamento con humanos, no hacemos las pruebas con dragones y unicornios.

Los datos sintéticos deben conservar el ADN estadístico de los datos originales y para ello contamos con los criterios que estableció [Alan Tomillero](https://www.x-trader.net/entrevista-a-alan-tomillero/) tras arrasar en Robotrader por 2º año consecutivo:

- Distribución de retornos similar
- Estructura de autocorrelación similar
- Clústeres de volatilidad similares

Para generar datos sintéticos que cumplan con los “criterios de Alan”, puedes utilizar el EA Synth Generator, que puedes descargar gratis en [https://synth-generator.ruleextraction.com](https://synth-generator.ruleextraction.com)

Lo que importa no es el mecanismo de generación, sino que los datos sintéticos respeten ese ADN estadístico.

## **Cómo Medir la Sobreoptimización**

Una vez que tienes la distribución de rendimientos sobre N datos sintéticos, puedes medir la sobreoptimización y hacer una mejor estimación del rendimiento de la estrategia.

Si una estrategia que tiene un edge real debería funcionar razonablemente bien en cualquier versión plausible del histórico original: si funciona muy bien en el original pero es mediocre en los sintéticos, es una señal de que el resultado del backtest depende en exceso de ese histórico en concreto.

En base a esa idea podemos construir una métrica de sobreoptimización:

_Overfitting Ratio = (Rendimiento\_original − Media\_sintéticas) / Desviación\_sintéticas_

![Distribución de resultados con datos sintéticos](https://www.x-trader.net/wp-content/uploads/2026/03/FIG_3-1024x338.png)

Distribución de resultados con datos sintéticos

Este ratio mide cuántas desviaciones estándar está el resultado original por encima de lo que obtiene la estrategia en los datos sintéticos.

Además, el propio promedio sobre las sintéticas es una estimación empírica del rendimiento de la estrategia con mayor significancia estadística que el rendimiento original.

## **Los Resultados del Experimento**

El trading no es una ciencia exacta, es una ciencia empírica: no basta con inferir analíticamente, de lo contrario cualquier matemático sería multimillonario.

Por eso realicé un experimento cuyos resultados presenté en Robotrader XVI: 374 reglas univariantes generadas con minería sobre 28 pares de FX en D1, cada un testeada contra 100 históricos sintéticos y 1 año de forward test para medir el impacto de los filtros basados en la distribución de rendimiento obtenida con los sintéticos.

![Supervivencia con filtro vs supervivencia sin filtro](https://www.x-trader.net/wp-content/uploads/2026/03/FIG_4-1024x792.png)

Supervivencia con filtro vs supervivencia sin filtro

La diferencia entre las reglas que superan el filtro de los sintéticos y las que no es difícil de ignorar.

Mismo universo de reglas y mismo forward test, lo que cambia es si validamos las reglas con los datos sintéticos o no.

## **Una Forma Diferente de Ver el Problema**

Lo que propongo con este enfoque es un cambio de perspectiva: no deberíamos poner el foco en cómo de bueno es el backtest, deberíamos preguntarnos cómo de dependientes son esos resultados del histórico sobre el que se han obtenido y esa respuesta la obtenemos con la distribución de resultados obtenida con los datos sintéticos.

Saludos,
Jaume

Nota: este artículo está basado en la ponencia titulada «Rule Extraction II: Validación de Reglas de Trading» que impartí en el ciclo de [conferencias de Robotrader 2026](https://www.x-trader.net/programa-de-conferencias-robotrader-2026/). Podéis ver el vídeo completo aquí:


_Recordad que el EA Synth Generator para MetaTrader 5, que genera las series sintéticas respetando los criterios estadísticos descritos en este artículo, está disponible de forma gratuita en [https://synth-generator.ruleextraction.com](https://synth-generator.ruleextraction.com)_

## Topics

**Categorías:** [Sin categoría](https://www.x-trader.net/wp-content/uploads/wp-mfa-exports/taxonomy/category/sin-categoria.md)