Definiciones previas
Distribución de probabilidad
Una distribución de probabilidad es la función que asigna una probabilidad a cada suceso del espacio muestral. Puede ser discreta (los valores posibles son finitos o infinitos numerables) o continua (los valores llenan un intervalo).
Variable aleatoria
Una variable aleatoria $X$ es la función que asigna un número real a cada elemento del espacio muestral. Si los valores que puede tomar son finitos o infinitos numerables, $X$ se llama discreta; si son infinitos no numerables (llenando un intervalo), se llama continua.
Ejemplos discretos: número de caras al lanzar 5 monedas, número de ases al sacar 3 cartas. Ejemplos continuos: altura de un estudiante, tiempo que dura una bombilla.
Función de probabilidad
Cuando $X$ es discreta, la función de probabilidad $f$ asigna a cada valor que puede tomar $X$ la probabilidad de obtenerlo: $f(x) = P(X = x)$.
Para que $f$ sea una función de probabilidad válida deben cumplirse dos condiciones:
Ejemplo — Lanzar un dado
Lanzamos un dado correcto. El espacio muestral es $E = \{1, 2, 3, 4, 5, 6\}$ y $X$ es la variable «cara obtenida».
La gráfica de la función de probabilidad es uniforme: 6 barras de la misma altura $\tfrac{1}{6}$.
Este caso es la llamada distribución uniforme discreta: todos los valores de $X$ tienen la misma probabilidad.
Las variables continuas también tienen distribuciones asociadas — la más conocida es la normal (la campana de Gauss) — pero en este curso nos centramos en distribuciones discretas, y en particular la binomial.
Problema de Bernoulli
Experimento de Bernoulli
Un experimento de Bernoulli es un experimento aleatorio con solo dos resultados posibles, que llamamos éxito y fracaso.
Denotamos:
Por construcción, $p + q = 1$.
Ejemplo — Penalti
Un futbolista tiene probabilidad $0{,}7$ de marcar un penalti. Lanzar el penalti es un experimento de Bernoulli con:
«Marcar» es el éxito y «fallar» el fracaso (la convención de qué es éxito y qué es fracaso la elegimos nosotros según la pregunta).
Distribución binomial
Definición
La distribución binomial es la distribución que sigue una variable aleatoria $X$ que cuenta el número de éxitos en $n$ repeticiones independientes de un experimento de Bernoulli con probabilidad de éxito $p$.
Se denota:
donde $n$ es el número de experimentos y $p$ la probabilidad de éxito individual.
Cuándo utilizar la binomial
Un fenómeno se modela bien con $B(n,p)$ si cumple las 4 condiciones siguientes:
1. Se repite $n$ veces un mismo experimento.
2. Cada experimento solo tiene dos resultados posibles (éxito / fracaso).
3. La probabilidad de éxito $p$ es constante en cada repetición.
4. Las repeticiones son independientes entre sí.
Ejemplo — Cinco penaltis
El mismo futbolista del ejemplo anterior lanza 5 penaltis. Decimos $X = $ «número de penaltis marcados». Entonces:
a) ¿Cuál es la probabilidad de marcar exactamente 3 penaltis?
Este valor se obtiene con la fórmula que veremos en el siguiente apartado, o consultando la tabla de la binomial.
b) ¿Cuál es la probabilidad de marcar como mínimo 3 penaltis?
«Como mínimo 3» equivale a $X \ge 3$. Se puede calcular por el complementario:
$P(X \le 2) = P(X{=}0) + P(X{=}1) + P(X{=}2)$ — la suma de los 3 primeros valores.
Fórmula de la binomial
Función de probabilidad de $B(n,p)$
Si $X \sim B(n,p)$, la probabilidad de obtener exactamente $k$ éxitos en $n$ pruebas es:
Donde $\binom{n}{k}$ es el número combinatorio (que definimos abajo) y $q = 1 - p$.
La fórmula tiene tres ingredientes:
· $\binom{n}{k}$ — de cuántas maneras se pueden colocar los $k$ éxitos entre las $n$ posiciones.
· $p^{k}$ — probabilidad de una secuencia concreta con $k$ éxitos.
· $q^{n-k}$ — probabilidad de los $n - k$ fracasos.
Aplicación al penalti — cálculo detallado
Con $X \sim B(5,\;0{,}7)$, calculamos $P(X = 3)$ aplicando la fórmula:
Números combinatorios
Definición
El número combinatorio «$m$ sobre $n$» es el número de subconjuntos de $n$ elementos que se pueden formar de un conjunto de $m$ elementos. Se denota y calcula:
Donde $m!$ es el factorial de $m$:
Ejemplos
· $5! = 5\cdot 4\cdot 3\cdot 2\cdot 1 = 120$.
· Calcular $C_{8,3} = \binom{8}{3}$:
· Calcular $\binom{5}{3}$ (el del penalti):
Truco de cálculo
Para calcular $\binom{m}{n}$ rápidamente, escribe los $n$ factores decrecientes desde $m$ en el numerador y $n!$ en el denominador:
Así no hace falta calcular $m!$ entero.
En la calculadora científica se teclean como nCr (combinatorio) y ! (factorial). Verifica siempre con una calculadora los números combinatorios que te aparezcan en un examen.
Probabilidades acumuladas
Con $X \sim B(5,\;0{,}7)$ podemos calcular cualquier probabilidad acumulada. Recordemos las fórmulas anteriores:
Comprobación: la suma de todos debe dar exactamente $1$. $0{,}00243 + 0{,}02835 + 0{,}13230 + 0{,}30870 + 0{,}36015 + 0{,}16807 = 1$ ✓.
Cálculos con $X \sim B(5,\;0{,}7)$
a) $P(X < 3) = P(X{=}0) + P(X{=}1) + P(X{=}2)$:
b) $P(X \ge 4) = P(X{=}4) + P(X{=}5)$:
O bien, por el complementario: $P(X\ge 4) = 1 - P(X\le 3) = 1 - 0{,}47178 = 0{,}52822$.
c) $P(X \le 2) = P(X{=}0) + P(X{=}1) + P(X{=}2) = 0{,}16308$ (es lo mismo que a)).
¡Cuidado con las desigualdades!
$P(X < 3)$ no incluye el 3: es $P(X{=}0) + P(X{=}1) + P(X{=}2)$.
$P(X \le 3)$ sí incluye el 3: es $P(X{=}0) + \cdots + P(X{=}3)$.
Lee siempre el enunciado con atención para saber si la desigualdad es estricta o no.
Esperanza y desviación típica
Parámetros de una binomial
Para una variable $X \sim B(n,p)$, la esperanza matemática (media) y la varianza tienen una fórmula muy simple:
Y por tanto la desviación típica:
Ejemplo — Los 5 penaltis
Con $X\sim B(5,\,0{,}7)$:
Lectura: si el futbolista lanzara series de 5 penaltis muchas veces, marcaría 3,5 penaltis de media, con una dispersión típica de aproximadamente 1 penalti alrededor de ese valor.
Interpretación intuitiva
· $E(X) = np$ — tiene sentido: si haces $n$ pruebas y en cada prueba hay probabilidad $p$ de éxito, esperas $np$ éxitos en total.
· $\mathrm{Var}(X) = npq$ — depende del producto $pq$, que es máximo cuando $p = 0{,}5$ (y es $0$ cuando $p = 0$ o $p = 1$). Es decir: la binomial es menos imprevisible cuando $p$ es muy próximo a 0 o a 1.
Ejercicios
Considera la función $f(x) = \dfrac{2x + 1}{6}$ con $x \in \{1, 2, 3\}$.
a) Calcula $f(1)$, $f(2)$ y $f(3)$.
b) ¿Puede ser $f$ una función de probabilidad? ¿Por qué?
Una función de probabilidad debe cumplir dos condiciones: $0 \le f(x_i) \le 1$ para todo $i$, y $\sum f(x_i) = 1$.
· $f(3) = \tfrac{7}{6} > 1$ → incumple la primera condición.
· Además, la suma:
También incumple la segunda condición.
La siguiente tabla ofrece la función de probabilidad de una variable aleatoria discreta $X$. Se desconoce $P(X{=}3)$.
| $x_i$ | 0 | 1 | 2 | 3 | 4 | 5 |
|---|---|---|---|---|---|---|
| $P_i$ | 0,2 | 0,2 | 0,1 | ? | 0,1 | 0,1 |
a) $P(X = 3)$.
Como la suma de todas las probabilidades debe ser 1:
b) $P(X > 3)$.
c) $P(X < 2)$.
Comprobación por el complementario: $P(X < 2) = 1 - P(X\ge 2) = 1 - (0{,}1 + 0{,}3 + 0{,}1 + 0{,}1) = 1 - 0{,}6 = 0{,}4$. ✓
d) $P(1 < X \le 5)$.
Atención: el límite inferior es estricto ($X > 1$), pero el superior incluye el 5.
e) La media, $E(X) = \sum x_i \cdot P_i$.
f) La desviación típica.
Calculamos primero la varianza $\mathrm{Var}(X) = \sum (x_i - E(X))^2 \cdot P_i$:
Recordatorio: $\mathrm{Var}(X) = E(X^2) - E(X)^2$ — un atajo que puede ahorrar trabajo. Aquí da $E(X^2) = 0 + 0{,}2 + 0{,}4 + 2{,}7 + 1{,}6 + 2{,}5 = 7{,}4$, así $\mathrm{Var}(X) = 7{,}4 - 2{,}2^2 = 7{,}4 - 4{,}84 = 2{,}56$. ✓
Sea $X \sim B(6,\;0{,}4)$. Calcula:
a) $P(X = 2)$.
b) $P(X = 0)$.
c) $P(X \ge 1)$ — al menos 1 éxito.
Por el complementario, más rápido:
d) $E(X)$ y $\sigma$.
El 80 % del alumnado de un instituto aprobó filosofía el curso pasado. De un grupo de 8 estudiantes elegidos al azar, ¿cuál es la probabilidad de que solo dos hayan suspendido esta asignatura?
a) Justifica que se trata de una distribución binomial.
Cada estudiante: aprobado o suspenso → es un experimento de Bernoulli. Repetimos el mismo experimento 8 veces (uno por cada estudiante), con probabilidad constante $p = 0{,}8$ (suponiendo independencia) → es una binomial $B(8,\,0{,}8)$.
b) Identifica la probabilidad de éxito y fracaso.
Si el éxito es «aprobar»: $p = 0{,}8$, $q = 0{,}2$.
Pero la pregunta es sobre el número de suspensos; conviene cambiar el éxito:
Si el éxito es «suspender»: $p = 0{,}2$, $q = 0{,}8$.
c) Determina la función de probabilidad.
Tenemos dos formulaciones equivalentes:
· $X_1 = $ «número de aprobados» $\sim B(8,\,0{,}8)$.
· $X_2 = $ «número de suspensos» $\sim B(8,\,0{,}2)$.
Si dos alumnos suspenden, aprueban seis. Por tanto, $X_2 = 2$ equivale a $X_1 = 6$. Trabajaremos con $X_2$, que refleja directamente la pregunta.
d) Calcula $P(\text{solo dos suspendan})$.
Comprobación: $P(X_1 = 6) = \binom{8}{6}\, 0{,}8^{6}\, 0{,}2^{2} = 28\cdot 0{,}262144\cdot 0{,}04 \approx 0{,}2936$. ✓ Coincide, como habíamos dicho.
Una línea de producción fabrica piezas con una probabilidad del 5 % de que cada una sea defectuosa. Se eligen 10 piezas al azar y se revisan.
a) Identifica la distribución y sus parámetros.
Sea $X = $ «número de piezas defectuosas». Entonces $X \sim B(10,\,0{,}05)$.
b) $P(\text{ninguna defectuosa})$.
Casi el 60% de los lotes de 10 piezas no tienen ninguna pieza defectuosa.
c) $P(\text{exactamente 2 defectuosas})$.
d) $P(\text{al menos 1 defectuosa})$.
Por el complementario:
e) $E(X)$ y $\sigma$.
De media hay media pieza defectuosa por lote de 10. La desviación típica es mayor que la media — es normal cuando $p$ es pequeña.
Un test tiene 20 preguntas con 4 opciones cada una y una sola correcta. Un alumno responde al azar, sin haber estudiado.
a) Identifica la distribución y sus parámetros.
Sea $X = $ «número de respuestas correctas». En cada pregunta, $p = \tfrac{1}{4} = 0{,}25$ (acertar al azar) y $q = 0{,}75$. Por tanto $X \sim B(20,\,0{,}25)$.
b) ¿Cuántas respuestas acertará de media?
c) ¿Cuál es la desviación típica?
d) $P(X = 10)$ — acierta exactamente 10 (la mitad).
Menos del 1%: la probabilidad de acertar la mitad de las preguntas por puro azar es prácticamente despreciable — de ahí viene la sensación de que «si respondo todo a suerte, seguro que suspendo».