¿Por qué 30?

¿Por qué 30?

P: ¿Cuál es la cantidad mínima de puntos de datos que se recomienda para estimar la desviación estándar?

R: Esta es una de las preguntas más comunes que se plantean a los profesionales de estadística. La respuesta más común de la mayoría de especialistas es "30". Entonces ¿por qué 30?

Para responder a la pregunta "¿Por qué 30?", necesitamos una breve explicación sobre el uso de las estadísticas para estimar los parámetros de población.

¿Qué es un parámetro de población?En el contexto de esta explicación, supongamos quedesea calcular la desviación estándar de la reproducibilidad de un método de prueba para un materialespecífico. La población de interés es entonces la población que contiene los resultados de una prueba a partir de un número infinito de laboratorios para el material específico que usan el mismo método de prueba, como se muestra en la Figura 1. Los dos principales parámetros de interés de la población son la media (μ) y la desviación estándar (σ).


Fig. 1 Histograma de los resultados individuales de toda la población de laboratorios

Si tuviéramos tiempo, paciencia y recursos infinitos, recogeríamos cada resultado de la "población" y calcularíamos los valores exactos para μ y σ usando todos los resultados. Como no tenemos recursos infinitos, podemos tomar una muestra aleatoria de tamaño n de la "población objetivo", hacer algunos cálculos y elaborar estadísticas para estimar los parámetros de la población deseada, como se muestra en la Figura 2. En la Figura 2, el promedio x̅ de la muestra es un estimador para μ, denotado por el "^" encima del carácter μ. De forma similar, la desviación estándar s de la muestra es un estimador para σ. Nos centraremos en la estadística s.

Las estimaciones tienen variabilidad debido al muestreo aleatorio. En otras palabras, si usted repite el proceso de muestreo aleatorio nuevamente, lo más probable es que obtendrá un valor numéricamente diferente para la misma estadística. Esto se conoce como la variabilidad de la estadística de muestra s, que es una función de σ y del tamaño de la muestra n.


Fig. 2 Visualización de uso de las estadísticas para estimar los parámetros de la población

La incertidumbre (debida al muestreo) cuando se usa s como un estimador de la σ verdadera (de la población) puede visualizarse por medio de un intervalo de confianza. Un intervalo de confianza representa una gama de valores plausibles dentro de la cual se cree que se encuentra la verdadera (σ), con un nivel de confianza especificado articulado en términos de probabilidad (típicamente establecido en 95%). Puede construirse un intervalo de confianza de 95% para σ a partir de una población con distribución normal multiplicando la desviación estándar s de la muestra por los factores de límite de confianza inferior y superior, de la manera siguiente:

(multiplicador de límite inferior del 95%) ∙ s ≤ σ ≤ (multiplicador de límite superior del 95%) ∙ s

Estos factores de límite de confianza se basan en una cantidad conocida como grados de libertad (df) para s (df = n - 1), el nivel de confianza especificado y una estadística Chi-cuadrado asociada. Los factores de límite de confianza de s para diferentes valores de df se dan en la Tabla 1.


Tabla 1: Multiplicadores de s para construir un intervalo de confianza de 95% para σ

Por ejemplo, si la desviación estándar s de la reproducibilidad con base en resultados individuales de 7 laboratorios es de 1,5, entonces un intervalo de confianza del 95% dentro del cual puede encontrarse la desviación estándar σ de la reproducibilidad verdadera (de la población) usando la Tabla 1 para df = (7 - 1) = 6, está entre (0,644) x 1,5 = 0,966 y (2,202) x 1,5 = 3,303. Si s se calcula utilizando resultados individuales de 31 laboratorios, el intervalo de confianza de 95% está entre (0,799) x 1,5 = 1,198 y (1,337) x 1,5 = 2,00. Tenga en cuenta que el ancho del intervalo de confianza para n = 31 es 0,802 unidades, en comparación con 2,337 unidades para n = 7, lo que representa una reducción del 66% de la incertidumbre mediante el aumento del tamaño de la muestra de 7 a 31.

Aunque el aumento del tamaño de la muestra reduce la incertidumbre, hay un punto de retorno decreciente. La comunidad estadística generalmente ha aceptado 30 grados de libertad como lo que proporciona la mínima incertidumbre aceptable para estimar σ.  Como se muestra en la Figura 3, la tasa de mejora (reducción del ancho del intervalo de confianza) comienza a aproximarse al punto de retorno decreciente más allá de 30.


Fig. 3: Visualización del intervalo de confianza de 95% como función de df

La conclusión es que aunque puede calcularse una estimación de la desviación estándar a partir de un conjunto de datos pequeño, las decisiones basadas en dichas estimaciones (de conjuntos pequeños de datos) pueden ser muy poco confiables. Más importante, debido a la distribución de la estadística s, los multiplicadores de límite inferior y superior del 95 % aumentan rápida y asimétricamente alrededor de 1 cuando los grados de libertad se aproximan a 0. Por lo tanto, para un tamaño n de la muestra pequeño (pocos grados de libertad), el riesgo de subestimar la σ de la población es considerable.

 

Alex T.C. Lau es un consultor en Whitby, Ontario, Canadá.

 

Issue Month
Julio/Agosto
Issue Year
2017
COMITÉ: