Incertidumbre: Parte 3, Función y estimación del sesgo

Incertidumbre: Parte 3, Función y estimación del sesgo

P.: ¿Qué es el sesgo y cómo puede abordarse?

R.: El sesgo se define en el Vocabulario Internacional de Metrología – Conceptos fundamentales y generales y términos asociados (International Vocabulary of Metrology – Basic and General Concepts and Associated Terms, VIM) como el “valor estimado de un error sistemático de medida”.1 A su vez, un error sistemático de medida se define como un “componente del error de medida que, en mediciones repetidas, permanece constante o varía de manera predecible”.

El manual Forma y estilo para los estándares de ASTM (Form and Style for ASTM Standards) (A22.1) indica:

“La incertidumbre de la medición es una estimación de la magnitud de los errores de medición sistemáticos y aleatorios que pueden informarse junto con el resultado de la medición. Una declaración de incertidumbre se refiere a un resultado particular obtenido en un laboratorio que realiza el método de prueba, a diferencia de las declaraciones de precisión y sesgo que son partes obligatorias del método mismo y que normalmente se derivan de un estudio entre laboratorios que se lleva a cabo durante el desarrollo del método de prueba”.

Tanto el VIM como el manual Forma y estilo dejan en claro que el sesgo es un componente del error de medición. El sesgo se debe determinar mediante pruebas y monitorear. Si está presente, debe estimarse y reducirse en la medida de lo posible. El sesgo no controlado representa un riesgo para la imparcialidad de los resultados de medición. La norma ISO/IEC 17025:2017 requiere la evaluación y monitoreo de los riesgos para la imparcialidad (Organización Internacional de Normalización/Comisión Electrotécnica Internacional 17025, Requisitos generales de competencia para laboratorios de pruebas y de calibración) (International Organization for Standardization/International Electrotechnical Commission 17025, General requirements for the competence of testing and calibration laboratories).

El sesgo “permanece constante o varía de manera predecible”. La forma más simple de considerar el sesgo es en conexión con el error aditivo y el multiplicativo. Esto no cubre todas las posibilidades, pero aborda efectivamente la mayoría de los casos prácticos. El error aditivo es el tipo más simple de error. Es un término de error aleatorio agregado al valor “verdadero” del mensurando (propiedad que se está midiendo) cuando se realiza una medición. Si el promedio de este término de error aditivo es fijo y distinto de cero, se lo llama “sesgo aditivo o constante”. La gran mayoría de los métodos estadísticos simples, como las pruebas t y la regresión por mínimos cuadrados ordinarios, suponen un error aditivo con sesgo cero.

El sesgo aditivo puede detectarse mediante el uso de materiales de referencia (RM) con valores de referencia aceptados (ARV) e incertidumbres conocidos y con un programa de control de la calidad que requiere mediciones periódicas de los RM. La práctica de la realización de pruebas de equivalencia en aplicaciones de laboratorio (E2935) no tiene en cuenta el sesgo por debajo de un umbral que representa una diferencia prácticamente significativa, que se define según el contexto de la aplicación2. El estándar puede utilizarse para evaluar la equivalencia de sesgos y si la media de las mediciones de un RM particular es equivalente (dentro del valor umbral) a su ARV.2 Si la prueba no puede rechazar la hipótesis de equivalencia, significa que el método de prueba es no sesgado para los fines prácticos al nivel del ARV y para los ítems de prueba que son comparables con el RM. Si se rechaza la equivalencia, se supone que el método de prueba tiene un sesgo igual a la diferencia entre la media de las mediciones y el ARV.

Otro método que es muy eficaz y también útil para el monitoreo del sesgo o el cambio del sesgo es el gráfico tabular de suma acumulativa (CUSUM) (Práctica para el uso de gráficos de control en el control estadístico de procesos, E2587) (Practice for use of control charts in statistical process control, E2587) para el RM, que utiliza el ARV o el ARV más el sesgo conocido como el valor objetivo del proceso. La CUSUM tabular también tiene un umbral, conocido como “banda floja” (“slack band”), que permite su utilización para el monitoreo de la equivalencia entre la media del proceso y un valor objetivo.

Habiendo detectado un sesgo para la medición de un RM dado, cabe hacer la pregunta: “¿Es constante en los niveles variables del mensurando y en los diversos tipos de ítems probados?”. El primer paso para responder esta pregunta son las pruebas rutinarias repetidas de otros RM con diferentes ARV y que, posiblemente representen diferentes tipos de ítems de prueba (como diferentes tipos de materiales o matrices de muestras). En estas secuencias de datos de control de la calidad (QC) también se determina mediante pruebas y se monitorea el sesgo frente a los ARV de sus respectivos RM, como se describió antes. Si se prueba solo un tipo de material y los RM varían solo por el nivel del mensurando, entonces puede utilizarse la regresión lineal (Práctica para el análisis de regresión, E3080) (Practice for regression analysis, E3080) de las mediciones sobre los ARV para determinar si hay un sesgo constante. Si el valor p de la regresión es pequeño (por ejemplo, <0,01), es una buena indicación de que el sesgo puede ser constante o casi constante.

En este caso, los datos de RM pueden combinarse restando de las mediciones los ARV correspondientes. Puede utilizarse una prueba de equivalencia de media 0 en los datos combinados para determinar si el sesgo es prácticamente cero y un gráfico de CUSUM con objetivo de proceso 0 para monitorear el sesgo. La combinación de los datos de QC de esta manera aumenta considerablemente la eficacia para detectar un sesgo existente y significativo en la práctica mediante el uso de pruebas estadísticas, y reduce el tiempo necesario para detectar un nuevo sesgo si el proceso de pruebas sufre una alteración.

El error multiplicativo es más complejo que el error aditivo. Es el tipo de error inducido cuando un factor o divisor de una fórmula de medición contiene un error. El sesgo multiplicativo o proporcional es un componente del error multiplicativo. Si se utilizan los RM con ARV en múltiples niveles, la regresión lineal de las mediciones sobre los ARV detecta y estima simultáneamente el sesgo aditivo y el multiplicativo. La constante o intersección en el modelo de regresión es el estimador del sesgo aditivo. Una pendiente igual a 1 indica que no hay sesgo multiplicativo. Por lo tanto, el sesgo multiplicativo se estima mediante la pendiente de regresión:1.

Mediante el uso de la regresión en la calibración lineal, se reducen y administran el sesgo aditivo y el multiplicativo.3 En este caso se aplica a los ARV una regresión sobre las indicaciones sin procesar del instrumento de medición (tensión, áreas de pico, corriente, deflexión, cuentas, etc.). La ecuación de regresión, entonces, proporciona directamente una función de calibración, con la indicación sin procesar de un ítem de prueba desconocido como entrada y una estimación del mensurando como salida. También puede haber ajustes de cantidades como la masa o el volumen de diluciones o incrementos de prueba.

Las condiciones del problema y las características de los datos determinan la forma más apropiada de la regresión. Sin embargo, una calibración que utilice los métodos de regresión apropiados minimiza los sesgos aditivo y multiplicativo, permite la estimación de su magnitud probable y al mismo tiempo maximiza la precisión de la estimación del mensurando. Esto ocurre también con la regresión no lineal aplicada a la calibración no lineal.

El lector puede preguntarse por qué esta calibración que utiliza métodos de regresión apropiados solo minimiza el sesgo sin eliminarlo por completo. La respuesta es que los coeficientes de regresión siempre se estiman con error, y este error se conoce probabilísticamente, pero no exactamente. Por lo tanto, es imposible corregirlo más. Con el tiempo, después de muchas calibraciones, las estimaciones y predicciones de parámetros son no sesgadas y tienen una varianza de error mínima. Sin embargo, durante el período en el que se usa una calibración particular, los errores en sus estimaciones de parámetros se convierten en sesgos. De todos modos, el sesgo es lo más pequeño posible siempre que la calibración siga siendo válida. Mediante el uso de intervalos de calibración y la confección de gráficos de control de la respuesta a un estándar de verificación intermedia de nivel medio o un estándar de calibración, es posible mantener la validez de la calibración. Esto responde a la necesidad de minimizar y administrar el sesgo, como se mencionó en el párrafo anterior.

El uso de métodos de regresión inapropiados en la calibración o la falta de monitoreo y aseguramiento de la validez continua de la calibración aumentan el sesgo y dificultan los intentos de administrarlo. Por ejemplo, en muchos métodos de prueba la desviación estándar de mediciones repetidas es una función creciente del nivel del mensurando. En este escenario, el uso de la regresión por mínimos cuadrados ordinarios en la calibración aumenta el error al estimar la intersección.3 Esto hace aumentar el sesgo aditivo durante el período en el que se utilizan estas calibraciones inapropiadas. Es similar al empleo de las calibraciones de intersección 0 (pendiente o intervalo únicamente) cuando el sesgo aditivo está presente y se detectaría mediante el empleo de la regresión con una intersección. Un problema relacionado es que los tipos diferentes de ítems de prueba o matrices de muestra pueden tener sesgos de medición muy diferentes, tanto aditivos como multiplicativos. Esto puede requerir el uso de RM que varían en tipo y en nivel de mensurando.

En resumen, para asegurar y monitorear la validez de los resultados de prueba y la imparcialidad del proceso de pruebas se debe evaluar, minimizar, monitorear y administrar el sesgo. Este trabajo requiere la implementación efectiva de varios elementos en el programa de control de calidad del laboratorio: RM con ARV conocidos; pruebas de rutina de estos RM; pruebas estadísticas de determinación del sesgo; monitoreo de los resultados de prueba de RM mediante gráficos de control; uso apropiado de la regresión en la calibración; intervalos de calibración apropiados, y monitoreo de la validez continua de las calibraciones.

Referencias
1. VIM3: Vocabulario internacional de metrología - Conceptos fundamentales y generales y términos asociados (VIM3: International Vocabulary of Metrology – Basic and General Concepts and Associated Terms), 3.a edición, Comité Conjunto para las Guías en Metrología (Joint Committee for Guides in Metrology), 2008.
2. Bzik, Tom, “Data Significance”, Data Points, ASTM Standardization News, Vol. 44, n.º 4, julio/agosto 2016, págs. 40-41.
3. Al-Ghamdi, K.S., “Calibration and Regression”, Data Points, ASTM Standardization News, Vol. 46, n.º 3, mayo/junio 2018, págs. 40-41.

John Carson, Ph.D., estadístico sénior de Neptune and Co., es el coordinador de la columna Puntos de datos (DataPoints). Es presidente del Subcomité sobre Control de calidad estadístico (E11.30), miembro del Comité sobre Calidad y estadísticas (E11) y miembro de los Comités sobre Productos a base de petróleo, combustibles líquidos y lubricantes (D02), Calidad del aire (D22), Cannabis (D37) y Evaluación ambiental, gestión de riesgos y acción correctiva (E50).

Issue Month
Mayo/Junio
Issue Year
2019
COMITÉ: