https://mran.microsoft.com/open/
E incluso un desarrollo para aplicaciones corporativas denominado Microsoft R Server:
https://www.microsoft.com/en-us/cloud-platform/r-server
Os iré contando más en detalle cosas que vea por aquí

Saludos,
X-Trader
Esto es lo mejor:X-Trader escribió:Vamos que si h4x0r y Tiotino lo dicen, habrá que pasarse a Python, ahora que me estaba acostumbrando a R
.
Bueno voy a ver si descubro su potencial, ¿alguna recomendación para iniciarse y trastear un poco?
Saludos,
X-Trader
Hola cls,cls escribió:Intervengo aquí porque se me ocurre que es un buen lugar para pedir ayuda en este tema, pero si X-Trader quiere cambiarlo de sitio, adelante.
Hace unos meses participé en una colaboración con unos data miners que investigaban series de precios + delta (volumen de órdenes a mercado: ask-bid). Lamentablemente no tuve contacto directo con ellos aunque yo les suministraba los datos, pero sí se me dijo que habían obtenido resultados espectaculares con sus pruebas de minería. Para más lamento, los mineros se esfumaron y el proyecto se detuvo. Lógicamente me quedé con las ganas de haber implementado un sistema para ver si los resultados prometidos se cumplían.
Me puedo considerar un programador no excesivamente malo y automatizar casi cualquier cosa, pero de minería de datos y demás temas relacionados no soy experto y me llevaría unos cuantos meses dar los primeros pasos y no digo ya adquirir la suficiente experiencia para analizar profesionalmente y con garantía estas series de datos.
Así que si algún experto en estos temas quisiera analizar series con estas características (en realidad son series más completas ya que incorporan lecturas de liquidez) por si pudiera encontrar patrones explotables o predicciones, pues encantado de proporcionar todos los datos necesarios y programar un sistema para beneficio mutuo.
Pongo una imagen del indicador del que obtendría los datos. Las series serían las del resumen inferior, donde están los datos de level1 o demanda: ask, bid, delta, así como del level2 u oferta: abastecimiento/retirada de limitadas en el bid y en el ask. Y aparte también el ohlcvt de todas las barras.
Es decir, que se dispondría del precio (ohlc) y de todas las fuerzas (oferta vs demanda) que están actuando en cada barra. Igual me equivoco, pero si de aquí no sale algo bueno, no sale de ningún sitio. Quiero decir, que está muy bien analizar sólo el ohlcv como hacen la mayoría de estudios (hasta ahora no he encontrado ningún paper de bigdata o machine learning que se base en poco más que el close), con resultados dispares por cierto; pero con el ohlc sólo se analiza el efecto. Analizando la oferta+demanda estaríamos analizando las auténticas causas que provocan los movimientos del precio.
La serie podría estar formada por registros con una estructura similar a ésta (para cada barra un registro):
open;high;low;close;volume;time;demandBid;demandAsk;supplyBid;supplyAsk
time: tiempo de desarrollo de la barra. Ya que suelo trabajar con barras de rango, este time es variable.
demandBid: volumen de todas las órdenes a mercado de venta en la barra.
demandAsk: volumen de todas las órdenes a mercado de compra en la barra.
supplyBid: indica el comportamiento de las órdenes limitadas en el BestBid. Si es positivo, es que se ha abastecido indicando sentimiento alcista. Y si es negativo, se ha retirado liquidez indicando sentimiento bajista.
supplyAsk: indica el comportamiento de las órdenes limitadas en el BestAsk. Si es positivo, es que se ha abastecido indicando sentimiento bajista. Y si es negativo, se ha retirado liquidez indicando sentimiento alcista.
omega: valor global de la interacción demanda vs oferta. Si es positiva, sentimiento alcista y bajista si es negativa.
Por ahora la liquidez sólo la contemplo en el ladder 0 del orderbook, en la horquilla, pero también se podrían añadir más ladders.
He echado un vistazo al ecosystem de R y de librerías de Python en estos temas y un mundo se queda pequeño. Así que lo dicho, si alguien ya conoce estos temas y tiene interés en hacer el análisis que me contacte y lo vemos. Gracias.
Tiotino escribió:Este es un tema muy parecido al de identificar números.
Se trata de identificar un número o patrón y luego ver que rentabilidad se obtiene con él.
Hay bastantes desarrollos en deep learning
h4x0r escribió: Hola cls,
Precisamente eso mismo que planteas es lo que tenía pensando hacer para mi proyecto de fin de master. Yo soy Ingeniero Informático y además estoy cursando un master de Big Data y Data Science para Finanzas en un escuela de Finanzas con gran reconocimiento. La idea que tenía para mi proyecto de fin de master era hacer data mining y machine learning sobre el level I y level II, justamente el gráfico de footprint que pones. También soy de los que piensa que si allí no encuentras un edge no lo encuentras en ningun sitio ya. Por eso tenía mucho interés en hacerlo sobre esos datos que son los que finalmente componen el precio, y no hacerlo directamente con el precio que es lo hace la mayoría sin grandes resultados.
...
Yo ya empecé con la primera parte del proceso. Que es el preprocesado de la información, estoy intentando pasar los datos de mi GomRecorder (Gom VolumeLadder) a un fichero entendible para cargarlo luego desde R o Python.
Saludos