Ejercicio 3 · Binomial, normal e intervalo de confianza — Tiempo de carga web
Distribución binomial, aproximación por la normal e intervalo de confianza para la media.
Puntuación máxima · 2,5 puntosUna empresa de telecomunicaciones considera que una página web es eficiente si su tiempo de carga es inferior a 3 segundos. La empresa afirma que al menos el 50 % de las páginas web que gestiona son eficientes. Para comprobar esta afirmación, se selecciona una muestra aleatoria de $n = 2500$ páginas web gestionadas por esta empresa.
Formulario del enunciado: $Z \sim N(0,1) \Rightarrow P(-1{,}96 \le Z \le 1{,}96) = 0{,}95$ y $P(-2{,}58 \le Z \le 2{,}58) = 0{,}99$; intervalos de confianza $\left[\hat{p} - z_{\gamma}\sqrt{\tfrac{\hat{p}(1-\hat{p})}{n}},\; \hat{p} + z_{\gamma}\sqrt{\tfrac{\hat{p}(1-\hat{p})}{n}}\right]$ para la proporción y $\left[\bar{x} - z_{\gamma}\tfrac{s}{\sqrt{n}},\; \bar{x} + z_{\gamma}\tfrac{s}{\sqrt{n}}\right]$ para la media.
- Se supone que, cada vez que se selecciona una página web para la muestra, esta puede ser eficiente (o no serlo) con una probabilidad $p = 0{,}5$, y que el hecho de que una página sea eficiente (o no) es independiente de que el resto lo sean (o no). Se considera la variable aleatoria $X$, que cuenta el número de páginas, de entre las 2500 de la muestra, que son eficientes. ¿Qué distribución tiene la variable $X$? Calcula la probabilidad de que como mucho 1299 páginas sean eficientes. Para ello, utiliza la aproximación por la distribución normal sin hacer la corrección por continuidad. 1,25 p
- En la muestra de $n = 2500$ páginas web, se ha obtenido una media muestral del tiempo de carga de $\bar{x} = 2{,}95$ segundos y una desviación típica muestral de $s = 0{,}38$ segundos. Construye un intervalo de confianza del 95 % para el tiempo medio de carga de las páginas web que gestiona la empresa. A partir del intervalo obtenido, ¿qué se puede decir sobre la afirmación de la empresa de que al menos el 50 % de las páginas web que gestiona son eficientes? 1,25 p
Corrección paso a paso
Idea clave: $X$ cuenta el número de éxitos en $n$ pruebas independientes con probabilidad de éxito constante: es una binomial. Como $n$ es muy grande, se aproxima por una normal de media $np$ y desviación $\sqrt{np(1-p)}$.
a) Distribución de $X$ y cálculo de la probabilidad
Cada página es eficiente con probabilidad $p = 0{,}5$, de manera independiente, y contamos los éxitos entre $n = 2500$:
Parámetros de la aproximación normal:
Por tanto $X \approx N(1250,\, 25)$. Tipificamos (sin corrección por continuidad, tal como pide el enunciado):
Como $P(-1{,}96 \le Z \le 1{,}96) = 0{,}95$, cada cola vale $0{,}025$ y, por tanto, $P(Z \le 1{,}96) = 0{,}95 + 0{,}025 = 0{,}975$.
b) Intervalo de confianza e interpretación
Muestra grande con varianza desconocida: usamos el intervalo para la media con $z_{\gamma} = 1{,}96$ (confianza del 95 %):
Todo el intervalo queda por debajo de 3 segundos: con una confianza del 95 %, el tiempo medio de carga de las páginas de la empresa es inferior a 3 segundos.
Este resultado es coherente con la afirmación de la empresa y le da apoyo: si el tiempo medio es claramente inferior a 3 s, es plausible que al menos la mitad de las páginas tarden menos de 3 s. (En rigor, el intervalo es para la media y la afirmación habla de la proporción de páginas eficientes; el intervalo no la demuestra, pero no la contradice.)