Correlación de n variables aleatorias

El espacio de los traders quant: sistemas de trading, gestión monetaria, automatización de sistemas.
Avatar de Usuario
Rafa7
Mensajes: 4919
Registrado: 17 Dic 2009 21:36
Contactar:

Correlación de n variables aleatorias

Mensaje por Rafa7 »

Sres. foristas,



Los que tenemos nociones básicas de estadística y probabilidad, conocemos bien la definición de la correlación de 2 variables aleatorias:

Correlación(X; Y) = Covariancia(X; Y) / (S(X) * S(Y))

Donde,
Covariancia(X; Y) = Esperanza(XY) - Esperanza(X) * Esperanza(Y).
S(X) = Esperanza(X^2) - Esperanza(X)^2
S(Y) = Esperanza(Y^2) - Esperanza(Y)^2.

Pero, ¿no existe el concepto de correlación de n variables aleatorias?

Me pongo a pensar y se me ocurre esto:

Correlación(X1; ...; Xn) = Covariancia(X1; ...; Xn) / (Sn(X1) * ... * Sn(Xn))
Donde
Covariancia(X1; ...; Xn) = Esperanza(X1 * ... * Xn) - Esperanza(X1) * ... * Esperanza(Xn)
Sn(Xi) = Esperanza(Xi^n) - Esperanza(Xi)^n, para todo i = 1, ..., n.

¿Voy bien?

¿Sabeis si en estadística/probabilidad alguien se ha planteado la correlación de n variables aleatorias y que tratamiento le ha dado?

Y, supongo que os preguntareis: ¿esto puede ser útil en el trading?
Pues tal vez lo sea, porque si tenemos n valores, sus rendimientos los podríamos considerar como n variables aleatorias de las cuales saber su correlación nos puede indicar si la cartera es equilibrada o no.

¿Alguien puede decirme algo al respecto?



Gracias.
¡Jesús es el Rey de Reyes y el Señor de Señores!
https://loquepermanece.blogspot.com
Speculator Man
Mensajes: 460
Registrado: 20 Dic 2016 18:28

Re: Correlación de n variables aleatorias

Mensaje por Speculator Man »

Rafa, el coeficiente de correlación entre dos variables aleatorias nos da una idea del grado de dependencia que tiene una de la otra. No veo que significado estadístico que puede tener un coeficiente de correlación de n variables todas juntas y revueltas y tampoco he visto que nadie calcule eso, entre otras cosas porque no es necesario, ya que para calcular si una cartera es equilibrada o no lo puedes hacer a partir de los coeficientes de correlación de cada uno de los pares de variables.
La microeconomía es lo que obtienes, la macroeconomía es lo que aguantas.
Avatar de Usuario
X-Trader
Administrador
Mensajes: 12781
Registrado: 06 Sep 2004 10:18
Contactar:

Re: Correlación de n variables aleatorias

Mensaje por X-Trader »

Hola Rafa7, tal y como te ha adelantado Speculator Man, no es posible calcular un coeficiente de correlación para más de dos variables, básicamente por como está construido. Para hacer lo que necesitas debes usar lo que se conoce como cópula (algo que, por cierto, usé en mi tesis doctoral para modelizar el VaR de una cartera) y que básicamente es una distribución estadística que enlaza varias distribuciones entre sí de diferentes características. Si quieres aprender más al respecto te recomiendo este PDF del Risklab:

BBVA-Risklab - 24-01.pdf
(1020.52 KiB) Descargado 119 veces

Por cierto, no te olvides de que aparte del coeficiente de correlación lineal de Pearson existen otros coeficientes como la tau de Kendall o la rho de Spearman que también se mencionan en esa presentación y son menos restrictivos en los supuestos que imponen sobre las series analizadas.

En todo caso, mucha gente me ha pedido un artículo sobre coeficientes de correlación y su aplicación al trading y al análisis de sistemas, espero tenerlo terminado para antes de que acabe el año.

Saludos,
X-Trader
"Los sistemas de trading pueden funcionar en ciertas condiciones de mercado todo el tiempo, en todas las condiciones de mercado en algún momento del tiempo, pero nunca en todas las condiciones de mercado todo el tiempo."
Avatar de Usuario
Rafa7
Mensajes: 4919
Registrado: 17 Dic 2009 21:36
Contactar:

Re: Correlación de n variables aleatorias

Mensaje por Rafa7 »

Speculator Man escribió: 01 Oct 2019 21:43 No veo que significado estadístico que puede tener un coeficiente de correlación de n variables
Gracias, Speculator Man.



Siempre es un placer leerte.

Consideremos n = 3.

Consideremos las diferentes posibilidades:
+++
-++
+-+
++-
---
+--
-+-
--+

Si las 3 variables aleatorias son independientes, las probabilidades de cada una de las 8 combinaciones será 1 / 8.
Ahora bien, hay dos posibilidades: O las 3 variables tienen el mismo signo (+++ o ---), o 1 de ellas tiene signo diferente a las otras dos (el resto de combinaciones).

La probabilidad, p, de que las 3 variables tengan el mismo signo(casos +++ y ---) es 2 / 8 = 1 / 4. Esto suponiendo que sean independientes.
Pero ¿y si no son independientes? ¿cómo lo sabremos? Pues si no son independientes, la frecuencia de que las 3 variables tengan p será superior a 1 / 4 (correlación positiva) o inferior a 1 / 4 (correlación negativa).

Entonces un indicador de correlación sería Correlación = p - 1 / 4, que oscila entre -1 / 4 y 3 / 4. (o sea, no oscila entre -1 y 1),

Speculator Man, ¿ahora sí ves el significado de la correlación de 3 variables aleatorias?



Saludos.
Última edición por Rafa7 el 02 Oct 2019 11:12, editado 4 veces en total.
¡Jesús es el Rey de Reyes y el Señor de Señores!
https://loquepermanece.blogspot.com
Avatar de Usuario
Rafa7
Mensajes: 4919
Registrado: 17 Dic 2009 21:36
Contactar:

Re: Correlación de n variables aleatorias

Mensaje por Rafa7 »

X-Trader escribió: 01 Oct 2019 22:56 no es posible calcular un coeficiente de correlación para más de dos variables
Gracias X-Trader,



Con la respuesta con que he respondido a Speculator Man, estoy también respondiendote.
Por favor, léete mi aporte inmediatamente anterior.
¿Qué te parece mi concepto de "correlación" de 3 variables aleatorias? ¿Lo vés útil?



Saludos.
Última edición por Rafa7 el 02 Oct 2019 11:00, editado 1 vez en total.
¡Jesús es el Rey de Reyes y el Señor de Señores!
https://loquepermanece.blogspot.com

Avatar de Usuario
Rafa7
Mensajes: 4919
Registrado: 17 Dic 2009 21:36
Contactar:

Re: Correlación de n variables aleatorias

Mensaje por Rafa7 »

Sres. foristas,



Por cierto, todos los que tenemos nociones básicas de estadísticas, sabemos como se calcula la correlación de 2 variables aleatorias, pero hay otra alternativa para medir la correlación:
Correlación(X; Y) = 2 * p - 1.
Donde p es la frecuencia con que sucede ++ o --.
Y como p oscila entre 0 y 1, 2 * p - 1 oscila entre -1 y 1.

La correlación medida como acabo de sugerir dará valores que no necesariamente coincidirán con la medida clásica que conocemos.

Ojo, me gusta más la medida clásica de la correlación (correlación(X; Y) = Covariancia(X; Y) / (S(X) * S(Y))), porque sí tiene en cuenta las volatilidades y porque hay mucha teoría basada en dicha medición. Solo muestro esta alternativa (que no tiene en cuenta las volatilidades) para expandir nuestras mentes en el sentido de que podríamos definir la correlación de otras maneras.



Saludos.
¡Jesús es el Rey de Reyes y el Señor de Señores!
https://loquepermanece.blogspot.com
Avatar de Usuario
Rafa7
Mensajes: 4919
Registrado: 17 Dic 2009 21:36
Contactar:

Re: Correlación de n variables aleatorias

Mensaje por Rafa7 »

Speculator Man escribió: 01 Oct 2019 21:43 tampoco he visto que nadie calcule eso
Gracias por la información, Speculator Man.



De eso se trata mi propuesta, de plantear a los estadísticos nuevos retos.
Reto a los estadísticos a que estudien el estadístico que he propuesto.



Saludos.
Última edición por Rafa7 el 02 Oct 2019 12:08, editado 3 veces en total.
¡Jesús es el Rey de Reyes y el Señor de Señores!
https://loquepermanece.blogspot.com
Avatar de Usuario
Rafa7
Mensajes: 4919
Registrado: 17 Dic 2009 21:36
Contactar:

Re: Correlación de n variables aleatorias

Mensaje por Rafa7 »

Speculator Man escribió: 01 Oct 2019 21:43 no es necesario, ya que para calcular si una cartera es equilibrada o no lo puedes hacer a partir de los coeficientes de correlación de cada uno de los pares de variables.
Aunque no sea necesario, mi indicador (me refiero al que he compartido en el 1r aporte de este hilo) podría ser una forma mucho más simple de calcular la correlación de una cartera. Imagina el cálculo de una cartera de 30 valores, si consideramos los pares 2 a 2, tenemos que considerar una matriz de 30 * 30 = 900 celdas y aplicar el valor de 465 (*) celdas (si eliminamos las celdas por debajo de la diagonal de la matriz) en nuestros cálculos (uffff), pero si usamos nuestro estadístico los cálculos son mucho más sencillos.

(*) En una matriz n * n de correlaciones 2 a 2, hemos de suprimir las celadas por debajo de la disgonal de la matriz porque Correlación(X; Y) = Correlación(Y; X). Entonces una matriz n * n tiene n^2 elementos. Y suprimiendo las celdas por debajo de la matriz, el número de elementos es n * (n + 1) / 2. En el caso de n = 30, n * (n + 1) / 2 = 30 * 31 / 2 = 465.
¡Jesús es el Rey de Reyes y el Señor de Señores!
https://loquepermanece.blogspot.com
Avatar de Usuario
Rafa7
Mensajes: 4919
Registrado: 17 Dic 2009 21:36
Contactar:

Re: Correlación de n variables aleatorias

Mensaje por Rafa7 »

Sres. foristas,



Otra alternativa para calcular la correlación de una cartera P1 * X1 + ... + Pn * Xn, donde X1, ..., Xn son los rendimientos de n valores y P1, ...Pn son las proporciones del capital arriesgado. (O sea, P1, ..., Pn son mayores que cero y P1 + ... + Pn = 1):

Correlación(P1 * X1 + ... + Pn * Xn) =
(S(A1 * X1 + ... + An * Xn) - (A1^2 * S(X1)^2 + ... + An^2 * S(Xn)^2)^0,5) / (A1 * S(X1) + ... + An * S(Xn)).
Donde S es la desviación típica.

El inconveniente es que este indicador no oscila, necesariamente, entre -1 y 1. Pero el signo de esta indicador sí que sería congruente: Si da positivo la cartera tiene correlación positiva, si da negativo la cartera tiene correlación negativa y si da cero la cartera es de valores descorrelacionados.



Saludos.
¡Jesús es el Rey de Reyes y el Señor de Señores!
https://loquepermanece.blogspot.com
Speculator Man
Mensajes: 460
Registrado: 20 Dic 2016 18:28

Re: Correlación de n variables aleatorias

Mensaje por Speculator Man »

Rafa7 escribió: 02 Oct 2019 10:39
Consideremos n = 3.
Consideremos las diferentes posibilidades:
+++
-++
+-+
++-
---
+--
-+-
--+

Si las 3 variables aleatorias son independientes, las probabilidades de cada una de las 8 combinaciones será 1 / 8.
Ahora bien, hay dos posibilidades: O las 3 variables tienen el mismo signo (+++ o ---), o 1 de ellas tiene signo diferente a las otras dos (el resto de combinaciones).

La probabilidad, p, de que las 3 variables tengan el mismo signo(casos +++ y ---) es 2 / 8 = 1 / 4. Esto suponiendo que sean independientes.
Pero ¿y si no son independientes? ¿cómo lo sabremos? Pues si no son independientes, la frecuencia de que las 3 variables tengan p será superior a 1 / 4 (correlación positiva) o inferior a 1 / 4 (correlación negativa).

Entonces un indicador de correlación sería Correlación = p - 1 / 4, que oscila entre -1 / 4 y 3 / 4. (o sea, no oscila entre -1 y 1),

Speculator Man, ¿ahora sí ves el significado de la correlación de 3 variables aleatorias?
Rafa7, yo no veo 3 variables veo 2 variables + y - cada una con una probabilidad de 1 / 2.
Cierto, si las agrupas de tres en tres tendrás ocho posibilidades con una probabilidad de 1 / 8 cada una, que podría ser equivalente a un dado de ocho caras, con 8 variables y la probabilidad de 1 / 8 que salga cada cara.

Los conceptos de correlación y coeficiente de correlación se aplican a las variables aleatorias continuas, muestreos que provienen de distribuciones normales, triangulares, uniformes…etc. El ejemplo que has puesto es más bien de variable aleatoria discreta donde no tiene sentido hablar de coeficientes de correlación. En variable aleatoria discreta se utiliza la probabilidad condicionada, por ejemplo, probabilidad de tener dolor de cabeza si previamente se tiene fiebre, que es diferente de la probabilidad de tener fiebre y de la probabilidad de tener dolor de cabeza en cualquier situación, aunque están relacionadas. Para ello se utiliza el Teorema de Bayes.
También se podrían incluir más variables y tomar muestras para ver si hay probabilidad condicionada, por ejemplo, probabilidad de tener dolor de cabeza si hoy tienes fiebre y ayer estuviste de copas hasta las cinco de la madrugada.

En el ejemplo que has puesto si después de realizar un gran número de tiradas agrupadas de 3 en 3 obtenemos que la probabilidad que salga +++ o que salga --- es diferente a 1 / 4 indicará que hay una probabilidad condicionada entre ellas o si es un dado de 8 caras con tiradas independientes nos indicará que las probabilidades iniciales de 1 / 8 para cada una de las 8 caras del dado no eran correctas.
La microeconomía es lo que obtienes, la macroeconomía es lo que aguantas.
Avatar de Usuario
Rafa7
Mensajes: 4919
Registrado: 17 Dic 2009 21:36
Contactar:

Re: Correlación de n variables aleatorias

Mensaje por Rafa7 »

Speculator Man escribió: 02 Oct 2019 21:07 Rafa7, yo no veo 3 variables veo 2 variables + y - cada una con una probabilidad de 1 / 2.
Uffff, Speculator Man, veo que no me has entendido.
Seguramente me estoy explicando mal.
X, Y, Z podrán ser los rendimientos diarios de Santander, Iberdrola y Repsol
Puede ocurrir que los 3 suban en un mismo día, o sea +++
Puede ocurrir que los 2 primeros bajen y e, tercero suba, o sea --+.
...
¿Ahora sí lo has entendido?

Por favor, vuélvete a leer mi aporte que has citado, y dime algo.



Gracias.
¡Jesús es el Rey de Reyes y el Señor de Señores!
https://loquepermanece.blogspot.com
Speculator Man
Mensajes: 460
Registrado: 20 Dic 2016 18:28

Re: Correlación de n variables aleatorias

Mensaje por Speculator Man »

No te había entendido que querías decir con +++ y con ---
Cierto, si la probabilidad de que salga +++ o --- es mayor que 1 / 4 tu cartera estará correlada positivamente y si es menor de 1 / 4 estará correlada negativamente.

Creo recordar que un estimador debía cumplir tres condiciones:
- Insesgado: la media de la distribución del estimador es igual al parámetro a estimar.
- Consistente: su valor se aproxima al parámetro cuanto mayor es n (tamaño de la muestra)
- Eficiente: Es de varianza mínima (su varianza es menor que la de cualquier otro estimador).

Buscar nuevos estimadores estadísticos es para los matemáticos especializados en estadística. Yo en tu caso contactaría con el departamento de estadística de la facultad de matemáticas de alguna universidad para que te indiquen como podrías enfocar el asunto.
La microeconomía es lo que obtienes, la macroeconomía es lo que aguantas.
Avatar de Usuario
Rafa7
Mensajes: 4919
Registrado: 17 Dic 2009 21:36
Contactar:

Re: Correlación de n variables aleatorias

Mensaje por Rafa7 »

Speculator Man escribió: 03 Oct 2019 02:54 No te había entendido que querías decir con +++ y con ---
Cierto, si la probabilidad de que salga +++ o --- es mayor que 1 / 4 tu cartera estará correlada positivamente y si es menor de 1 / 4 estará correlada negativamente.
Gracias, Speculator Man.



El objetivo de comparar la probabilidad, de +++ o ----, con 1 / 4, era mostrar que tiene sentido hablar de "correlación de 3 variables aleatorias". Y supongo que, al menos intuitivamente, entiendes el concepto que quería compartir.

Y podemos extender que tiene sentido hablar de correlación de n variables aleatorias, a pesar de que a nadie se le haya ocurrido tal concepto,y, que, por lo tanto nadie lo ha estudiado y a nadie se le ha ocurrido crear un indicador para medir la correlación de n variables aleatorias.

Yo reto, a los estadísticos, a que definan el concepto de correlación de n variables y diseñen un indicador que lo mida. De entrada, yo propongo el indicador que he compartido en mi 1r aporte en este hilo.
Speculator Man escribió: 03 Oct 2019 02:54 Creo recordar que un estimador debía cumplir tres condiciones:
- Insesgado: la media de la distribución del estimador es igual al parámetro a estimar.
- Consistente: su valor se aproxima al parámetro cuanto mayor es n (tamaño de la muestra)
- Eficiente: Es de varianza mínima (su varianza es menor que la de cualquier otro estimador).
Gracias, Speculator Man por compartir estas condiciones, las cuales me parecen muy oportunas en este hilo.

Tener un indicador que mida la correlación de n variables aleatorias sería muy útil en trading. Probablemente si algún día alguien demuestra que un indicador que mide la correlación de n variables aleatorias cumple las 3 condiciones que mencionas, sería alguien que fuese estadístico y trader (por ejemplo, alguien con el perfil de X-Trader), ya que los más interesados en dicho indicador seríamos nosotros los traders.
Speculator Man escribió: 03 Oct 2019 02:54 Buscar nuevos estimadores estadísticos es para los matemáticos especializados en estadística. Yo en tu caso contactaría con el departamento de estadística de la facultad de matemáticas de alguna universidad para que te indiquen como podrías enfocar el asunto.
Gracias Speculator Man por la sugerencia.



Saludos.
¡Jesús es el Rey de Reyes y el Señor de Señores!
https://loquepermanece.blogspot.com
Avatar de Usuario
X-Trader
Administrador
Mensajes: 12781
Registrado: 06 Sep 2004 10:18
Contactar:

Re: Correlación de n variables aleatorias

Mensaje por X-Trader »

Rafa7 escribió: 03 Oct 2019 00:24
Speculator Man escribió: 02 Oct 2019 21:07 Rafa7, yo no veo 3 variables veo 2 variables + y - cada una con una probabilidad de 1 / 2.
Uffff, Speculator Man, veo que no me has entendido.
Seguramente me estoy explicando mal.
X, Y, Z podrán ser los rendimientos diarios de Santander, Iberdrola y Repsol
Puede ocurrir que los 3 suban en un mismo día, o sea +++
Puede ocurrir que los 2 primeros bajen y e, tercero suba, o sea --+.
...
¿Ahora sí lo has entendido?

Por favor, vuélvete a leer mi aporte que has citado, y dime algo.



Gracias.
Vale Rafa7, creo que ya sé por donde va el tema: revisa la construcción de carteras óptimas de Markowitz, ahí quizás encuentres respuestas a lo que buscas. Echa un vistazo a este PDF, viene desarrollado para el caso de 2 y de n activos:


Saludos,
X-Trader
"Los sistemas de trading pueden funcionar en ciertas condiciones de mercado todo el tiempo, en todas las condiciones de mercado en algún momento del tiempo, pero nunca en todas las condiciones de mercado todo el tiempo."
Avatar de Usuario
Rafa7
Mensajes: 4919
Registrado: 17 Dic 2009 21:36
Contactar:

Re: Correlación de n variables aleatorias

Mensaje por Rafa7 »

X-Trader escribió: 03 Oct 2019 11:11 revisa la construcción de carteras óptimas de Markowitz
Gracias, X-Trader.



Este enfoque tiene un inconveniente: requiere, para n variables aleatorias, calcular n * (n + 1) / 2 correlaciones 2 a 2. En cambio en el enfoque que propongo en el 1r aporte de este hilo no hay necesidad de calcular ninguna correlación 2 a 2, salvo en el caso n = 2, con lo cual los cálculos son mucho mas sencillos.

¿Estás de acuerdo en que si en 3 valores la probabilidad de que los 3 a la vez suban o a la vez bajen, es mayor que 1 / 4, podemos decir que los 3 valores tienen correlación positiva, y si es menor que 1 / 4, podemos decir que los 3 valores tienen correlación negativa?

Si tu respuesta es sí, estarías afirmando que tiene sentido el concepto de correlación de 3 variables aleatorias. Si tu respuesta es no, estarías negando dicho concepto.



Saludos.
¡Jesús es el Rey de Reyes y el Señor de Señores!
https://loquepermanece.blogspot.com
Si te ha gustado este hilo del Foro, ¡compártelo en redes!


Responder

Volver a “Sistemas de Trading”