Probabilidad y Estadística

Ley de los Grandes Números

Por qué el EV se realiza en el largo plazo, cuántos trades necesitas para que tu edge se materialice, y la relación con el Teorema Central del Límite.

La Ley: Media Muestral → Media Poblacional

La Ley de los Grandes Números (LLN, por sus siglas en inglés) es uno de los teoremas fundamentales de probabilidad. En su forma intuitiva dice: el promedio empírico de un número grande de observaciones independientes converge a la media teórica (esperada). Formalmente: si X₁, X₂, X₃, ..., Xₙ son variables aleatorias iid con media finita μ, entonces cuando n → ∞, la media muestral X̄ₙ = (X₁ + X₂ + ... + Xₙ) / n converge a μ. En términos del trading, si tu estrategia tiene expected value verdadero de $15 por trade, al ejecutar muchos trades independientes, el promedio observado de tu PnL por trade convergerá a $15. Esta es la razón matemática por la cual un edge positivo sostenido genera ganancias en el largo plazo, aunque trade individual puede ganar o perder. La LLN es la fundamental justification del trading sistemático y del investing a largo plazo. Fue probada rigurosamente en el siglo XVII por Jacob Bernoulli y extendida por Chebyshev y Kolmogorov. Es una piedra angular de la teoría de probabilidades, de la estadística inferencial, y de las finanzas cuantitativas modernas. Sin la LLN, no habría forma de construir edges estadísticos que rindan dinero confiablemente —sería puro gambling.

Ley Débil vs. Ley Fuerte

Matemáticamente hay dos versiones de la LLN, con importancia técnica pero implicaciones prácticas similares. (1) Ley Débil de los Grandes Números (Bernoulli 1713, Khinchin): afirma convergencia en probabilidad. Para cualquier ε > 0, Pr(|X̄ₙ − μ| > ε) → 0 cuando n → ∞. Intuitivamente: "la probabilidad de que la media muestral esté lejos de μ se hace arbitrariamente pequeña con n grande". (2) Ley Fuerte de los Grandes Números (Borel 1909, Kolmogorov): afirma convergencia casi segura (almost sure). Pr(X̄ₙ → μ) = 1 cuando n → ∞. Intuitivamente: "con probabilidad 1, la media muestral converge a μ". La Ley Fuerte es estrictamente más fuerte que la Ley Débil: implica la Débil, pero no viceversa. Para aplicaciones prácticas en trading, la distinción es académica —ambas garantizan que tu promedio a largo plazo converge al EV verdadero. Pero ambas versiones tienen un caveat crítico: asumen que las variables tienen media finita. En distribuciones con colas extremadamente gordas (ej. Cauchy, con varianza infinita), la LLN puede fallar: la media muestral no converge. En finanzas, mientras los retornos tengan varianza finita (lo cual típicamente es el caso), LLN aplica, pero la convergencia puede ser mucho más lenta de lo que modelos normales sugieren.

Aplicación Directa en Trading

La LLN tiene implicaciones prácticas diarias para traders. (1) Paciencia con edge estadístico: si tu estrategia tiene EV +$20 por trade y haces 200 trades al año, el EV anual es +$4,000, pero el resultado actual puede ser cualquiera dentro de un rango amplio en un año específico. La convergencia a EV requiere muchos trades —típicamente cientos o miles— y el proceso es ruidoso. Un buen trader con edge +$20 por trade puede perfectamente tener tres meses perdiendo dinero en fila por pura variance estadística. Entender esto es crucial para no abandonar estrategias correctas en drawdowns. (2) Diversification multiplica la convergencia: ejecutar múltiples trades paralelos independientes aumenta el "n" efectivo y acelera la convergencia al EV de portafolio. Operar 1 trade por semana con edge +$20 es muy distinto de operar 20 trades por semana con el mismo edge —el segundo converge 20× más rápido a su EV agregado. (3) Time required to see edge: si la varianza σ² por trade es $500, el standard error del estimate de EV después de n trades es σ/√n. Para tener 95% confidence de que tu EV observado está dentro de $5 del verdadero con σ=500, necesitas n ≈ (1.96 × 500 / 5)² ≈ 38,416 trades. Para $10 de precision: n ≈ 9,604. Esto es un número sorprendentemente alto. Esto implica que la mayoría de traders retail no tiene suficientes trades para tener significance estadística sobre su estrategia; el que "funcionó por 50 trades" no prueba nada rigurosamente.

El Teorema Central del Límite

Relacionado pero distinto a la LLN está el Teorema Central del Límite (TCL), que es arguiblemente aún más poderoso. Mientras la LLN describe dónde converge la media muestral (a μ), el TCL describe cómo se distribuye alrededor de μ para n grande. El TCL dice: para X₁, X₂, ..., Xₙ iid con media μ y varianza σ² < ∞, la variable √n × (X̄ₙ − μ) / σ converge en distribución a una normal estándar N(0, 1) cuando n → ∞. Esto es extraordinario: sin importar la forma de la distribución original (normal, uniform, exponencial, bimodal, lo que sea), el promedio muestral se distribuye aproximadamente normal para n grande. Implicaciones: (1) Confidence intervals: podemos construir intervalos de confianza para μ basados en X̄ₙ ± z × σ/√n; es la base de prácticamente toda estadística inferencial. (2) Tests de hipótesis: bajo el null hypothesis H₀: μ = μ₀, el estadístico (X̄ₙ − μ₀) / (σ/√n) sigue N(0,1) aproximadamente. (3) Why la normal aparece en todas partes: promedios de muchas variables independientes (mediciones, errores, retornos de muchos trades) naturalmente convergen a normal, razón por la cual la distribución normal es tan común. En trading, el TCL implica que los retornos anuales de una estrategia con muchos trades tienden a ser aproximadamente normales incluso si los retornos de trades individuales son altamente no-normales. Esto facilita modelar performance a nivel portfolio.

Cuántas Muestras Necesitas Realmente

Una pregunta frecuente pero rarely answered con rigor: ¿cuántos trades necesito para probar que tengo edge? La respuesta depende del tamaño del edge relativo a la varianza. Usando el TCL, el número de trades necesarios para distinguir estadísticamente un edge μ de cero con 95% confidence y power 80% es aproximadamente: n ≈ 8 × (σ/μ)². Ejemplos: (1) Edge $15 por trade, σ=$200: n = 8 × (200/15)² = 1,422 trades. (2) Edge $5 por trade, σ=$200: n = 8 × (200/5)² = 12,800 trades. (3) Edge $20 por trade, σ=$100: n = 8 × (100/20)² = 200 trades. La conclusión práctica es sobria: la mayoría de traders no tienen suficientes trades para demostrar edge con significance estadística. Esto tiene varias implicaciones: (a) no confíes en "tracks" de menos de 200-500 trades; son muy probablemente ruido; (b) systematic traders con alta frecuencia (market makers, HFT) acumulan evidence rápidamente porque hacen miles de trades al día; (c) long-term fundamentales (Buffett-style, 1-5 trades al año) nunca tendrán significance estadística sobre su estrategia; dependen de tesis qualitativa y timing; (d) backtests pueden engañar: un backtest de 1,000 trades parece robusto pero puede estar sobre un solo régimen de mercado; necesitas data que cubra múltiples ciclos.

LLN, Casinos y la Paradoja del Jugador

La LLN explica perfectamente por qué los casinos siempre ganan. Cada juego tiene EV negativo para el jugador por design —ruleta americana tiene house edge 5.26%, blackjack sin conteo ~1%, slot machines 5-15%. Para cada apuesta individual, el outcome es incierto (puedes ganar o perder), pero over miles de apuestas por día y millones por año, la LLN garantiza que el resultado agregado converge al house edge. Un casino mediano genera $100M+ en house edge anualmente por pura matemática. Interesantemente, el principio se invierte perfectamente para el trader con edge genuine: hace "casino" de sí mismo, jugando con ventaja estadística en su favor. Los hedge funds exitosos (Medallion, SAC, Citadel) operan millones de trades al año; la LLN garantiza que si realmente tienen edge, ese edge se materializa en dollars. Una paradoja relacionada es la Paradoja del Jugador (Gambler's Fallacy): el sesgo cognitivo de creer que después de varias pérdidas, una ganancia es "más probable" para "balancear" las cosas. Esto es falso para variables iid —cada evento es independiente del anterior. Si has perdido 10 coin flips seguidos, la probabilidad del 11avo sigue siendo 50/50 (asumiendo fair coin). La LLN solo garantiza convergencia de promedios en sample grandes, no "compensación" en eventos individuales. Este sesgo destruye traders que aumentan size after losses ("martingale") —eventualmente una racha mala grande los elimina.