Medición de un error aleatorio en un dato estadístico informado
Medición de un error aleatorio en un dato estadístico informado
Q: ¿Qué es el error estándar y cómo se lo utiliza en la práctica?
R: Uno de los conceptos más útiles en la práctica estadística es justamente el de "error estándar". Este término fue definido originalmente por el estadístico británico Udny Yule a comienzos del siglo XX. La norma E2586 de ASTM, Práctica para calcular y usar estadísticas básicas, define el error estándar como "la desviación estándar de la población de valores de una estadística muestral en un muestreo repetido o su estimación". El término incertidumbre está estrechamente relacionado con el error estándar y en las últimas décadas se la he dedicado bastante atención. El error estándar mide el error aleatorio en un dato estadístico informado: el tipo de error causado por la variación aleatoria del muestreo al repetir una prueba en las mismas condiciones. La incertidumbre es un concepto más amplio que incluye componentes adicionales de error potencial además del error aleatorio. La norma E2655 de ASTM, Guía para informar la incertidumbre de los resultados de pruebas y Uso del término incertidumbre de la medición en métodos de prueba de ASTM, describe el uso del concepto de incertidumbre tal como se lo aplica al resultado de una prueba.
En general, las personas que toman las decisiones y los usuarios que utilizan los datos suelen estar más preocupados por los datos estadísticos que por las mediciones individuales en un grupo de datos. Los usuarios de datos desean ver promedios, varianzas, rangos, proporciones, valores máximos o mínimos, percentilos u otras estadísticas. Lo que a menudo no logran apreciar totalmente es que las estadísticas también se comportan de una manera aleatoria, similar a la de las mediciones individuales, y esto se mide con el error estándar. Cuando se informa la media de una muestra, no se informa el promedio "verdadero" sino una estimación. La estadística muestral puede resultar levemente superior o inferior al valor verdadero desconocido. El error estándar de la media mide la diferencia que puede existir entre la media verdadera y la estadística que se informa. En términos más generales, podemos hablar del "error estándar de la estimación" cada vez que se informa una cantidad estadística estimada. Cuando se calcula un dato estadístico único, es posible calcular el error estándar de la estimación. En general, cuanto mayor sea el tamaño de la muestra, menor será el error estándar de una cantidad estimada.
Para ver cómo funciona esto, analicemos una media muestral. A partir de una muestra de tamaño n, se calculan la media muestral y la desviación estándar. En realidad hay una media verdadera, μ, y una desviación estándar verdadera σ, y son desconocidas. La muestra nos brinda las estimaciones y S. Si hiciéramos muestras repetidamente de la población/proceso del cual se toma la muestra y calculáramos la media muestral una y otra vez, la desviación estándar de la distribución de medias sería el error estándar verdadero de la media. En teoría, esta es la Ecuación 1:
1)
Debido a que solo tenemos una media estimada, y no conocemos el verdaderos σ, solo podemos estimar el error estándar como:
2)
El error en un resultado informado se llama error de muestreo, y se mide como desviación absoluta del valor verdadero desconocido. Por lo tanto, para una media, el error muestral puede considerarse como la desviación | - μ| . Alrededor del 68% de las veces el error muestral tendrá como máximo el tamaño de un error estándar, y en el 95% de los casos, el de 2 errores estándar. Esto puede expresarse más concisamente de la siguiente manera:
3)
4)
Ejemplos
Consideremos que en una muestra de tamaño n = 20 se determinó que la media muestral y la desviación estándar eran 162 y 11,5 respectivamente. El error estándar estimado de la media surge de la Ecuación 2: 11,5/4,47 = 2,57. De este modo, el potencial de error en el resultado informado no es superior a ±2,57 (68% de confianza) o no más de 2(2,57) = ±5,14 (a 95% de confianza).
Uno de los recursos estadísticos más utilizados es una proporción simple. Hay una muestra de objetos de tamaño n, y se observa cada objeto para identificar la ocurrencia de un atributo. Cada objeto tiene o no tiene el atributo. Esta es la situación, por ejemplo, en los muestreos de control de calidad o en las encuestas de opinión pública. La estadística, indicada , es la proporción en la muestra que tiene ese atributo. La proporción verdadera y desconocida de todos los objetos es p. El error estándar teórico de la estimación es:
5)
En la práctica no conocemos nunca el valor verdadero de p, de modo que reemplazamos la estadística y obtenemos una estimación del error estándar. Utilizando la Ecuación 5, el error estándar estimado es:
6)
Cuando esta técnica se utiliza en una encuesta política o una investigación de mercado, la cantidad 2SE()se menciona como margen de error de la encuesta. Supongamos que en una muestra de n = 200 componentes de metal inspeccionados, se clasificaron 23 como defectuosos. La estimación de la proporción defectuosa del proceso es = 23/200 = 0,115 o 11,5%.
El error estándar de esta estimación, usando la Ecuación 6, es 0.0226 o 2,26%. En caso de querer reclamar una confianza de aproximadamente 95% en el posible error en el resultado, deberíamos informarlo utilizando dos errores estándar o como 11,5% ±4,52%. De todos modos, debería informarse al menos el error estándar (2,26%) junto con la estimación.
En la E2586 de ASTM están disponibles las fórmulas de error estándar para varios casos comunes. En la bibliografía sobre ciencias estadísticas pueden consultarse otros casos y métodos.
Referencias
1. Stephen N. Luko y Dean V. Neubauer, “Statistical Intervals, Part 1: The Confidence Interval,” ASTM Standardization News, Vol. 39, Núm. 4, julio/agosto 2011.
Stephen N. Luko, de United Technologies Corp./Collins Aerospace, Windsor Locks, Connecticut, es el anterior presidente del Comité E11 sobre calidad y estadísticas y es miembro de ASTM International.
John Carson, Ph.D., estadístico sénior de Neptune and Co., es el coordinador de columnas de Puntos de datos. Es presidente del subcomité de control de calidad estadístico (E11.30), miembro del comité de calidad y estadísticas (E11) y miembro de los comités de productos a base de petróleo, combustibles líquidos y lubricantes (D02), calidad del aire (D22), cannabis (D37) y evaluación ambiental, gestión de riesgos y acción correctiva (E50).