Una observación sobre los datos de confiabilidad
Una observación sobre los datos de confiabilidad
Obtenga la máxima cantidad de información de los datos de confiabilidad cuando solo se dispone de información parcial.
Al realizar una evaluación de confiabilidad, ¿qué sucede si se desconoce el valor exacto de un punto de datos?
La confiabilidad se define como “la probabilidad de que un componente, dispositivo, producto, proceso o sistema funcione o cumpla una función después de un tiempo determinado o de que se utilice en condiciones determinadas” (de la guía de estándares de confiabilidad general, E3159). La confiabilidad también se puede utilizar de forma más general como una medida de la calidad a lo largo del tiempo o de una secuencia de uso o de demanda. En la industria, las evaluaciones de confiabilidad pueden ser necesarias para determinar la capacidad del material, la capacidad de inspección, la vida útil y los requisitos de mantenimiento, entre otras aplicaciones. Los datos de confiabilidad a menudo se recopilan a través de un experimento o en el campo.
Muchos métodos de análisis estadísticos tradicionales asumen que la variable de respuesta es un valor exacto en todos los casos. Sin embargo, en las aplicaciones de confiabilidad, es posible que no se conozca el valor exacto de la respuesta. Por ejemplo, al recopilar datos de tiempo de falla en un entorno experimental, el experimento podría haberse detenido antes de que todas las unidades hayan fallado. El hecho de que la unidad no fallara no significa que no se pueda obtener información sobre el tiempo de falla de esa unidad. Por el contrario, se sabe que el tiempo de falla de la unidad que “sobrevivió” es algún tiempo después del punto en el que se detuvo el experimento.
Si para analizar los datos se utiliza un método estadístico que requiere un valor exacto para cada respuesta, las unidades que sobrevivieron tendrían que excluirse del análisis o tratarse como una unidad fallida, con un tiempo de falla igual al tiempo en el que se detuvo el experimento. Sin embargo, esto puede conducir a resultados seriamente engañosos. Por fortuna, se han desarrollado métodos estadísticos avanzados para tratar este tipo de datos, denominados datos censurados.
En este artículo se abordan, principalmente, la identificación y clasificación de los datos censurados mediante ejemplos de desarrollo de las propiedades de los materiales, probabilidad de detección y pruebas/evaluaciones de vida útil. Solo se analiza un método estadístico para ilustrar cómo se manejan los datos censurados en el análisis.
En general, hay tres tipos de datos censurados: censurados a la derecha, censurados a la izquierda y censurados por intervalos. En este caso, yi representa la respuesta de la unidad i. Un punto de datos censurado a la derecha es aquel en el que hay un límite inferior yiL para la respuesta i. Es decir, el valor exacto de la respuesta se encuentra en algún lugar del intervalo (yiL, ∞). Un punto de datos censurado a la izquierda es aquel en el que hay un límite superior yiU para la respuesta i. Es decir, el valor exacto de la respuesta se encuentra en algún lugar del intervalo (-∞, yiU]. Un punto de datos censurado por intervalos es aquel en el que yi se encuentra dentro de algún límite inferior yiL y algún límite superior yiU. Es decir, el valor exacto de la respuesta se encuentra en algún lugar del intervalo (yiL, yiU]. La censura puede ser aleatoria o predeterminada [1].
Los datos censurados a la derecha se encuentran a menudo en el desarrollo de la curva de propiedades del material.
Al desarrollar una curva de fatiga que relaciona la tensión y los ciclos hasta la falla para un material en particular, por ejemplo, los datos se recopilan a través de un experimento. Con frecuencia, el experimento se diseña de manera que cada muestra se asigna aleatoriamente a un nivel de tensión determinado por debajo del cual se someterá a un número máximo de ciclos. En otras palabras, el experimento está diseñado para detenerse cuando la muestra falla o cuando se alcanzan los ciclos máximos. Tenga en cuenta que la censura en este caso está predeterminada por las condiciones de prueba establecidas.
Supongamos que la cantidad máxima de ciclos a la que se expone una sola muestra de ensayo a un nivel de tensión determinado es de 100.000. Supongamos que una muestra que se sometió al nivel de tensión más bajo alcanzó el límite de prueba de 100.000 ciclos sin fallar. Si se hubiera permitido que la prueba continuara, la muestra probablemente habría fallado en algún momento. La información recopilada de esta muestra que “sobrevivió” es que su tiempo de falla es algún tiempo después (o a la derecha) de 100.000 ciclos para el nivel de tensión determinado. Por consiguiente, el tiempo de falla se registra como (100.000, ∞).
Los datos censurados a la izquierda son comunes en experimentos diseñados para demostrar la capacidad de detección de un sistema de inspección por corrientes de Foucault. La inspección por corrientes de Foucault se utiliza comúnmente para detectar anomalías en la superficie o cerca de la superficie —como grietas— en materiales metálicos. A medida que la sonda explora la superficie del material metálico, genera un campo magnético. Cualquier cosa ubicada en el campo magnético que tenga propiedades eléctricas y/o magnéticas (como una grieta superficial o casi superficial) cambiará el campo y producirá una señal por corrientes de Foucault. Se espera que la señal de corrientes de Foucault medida aumente a medida que aumenta el tamaño del defecto.
Entender la relación entre el tamaño de la grieta y la respuesta de la señal de corrientes de Foucault es la base para determinar la capacidad de detección (a menudo denominada probabilidad de detección) de un sistema de corrientes de Foucault. Los datos censurados a la izquierda se producen cuando el sistema de inspección no puede distinguir la señal generada por un pequeño defecto del ruido inherente en el sistema y/o material de las corrientes de Foucault. En este caso, la censura está predeterminada por el ruido inherente. Por ejemplo, supongamos que se sabe que el umbral de ruido es de 1 división.
Es decir, cualquier señal por debajo de 1 división es indistinguible del ruido. Si la señal medida de un pequeño defecto cae por debajo de 1, la respuesta a ese defecto se registra como (0,1). En otras palabras, la señal medida exacta es una amplitud a la izquierda de 1, o dentro del ruido.
Los datos censurados por intervalos están a menudo presentes en los datos resultantes de la inspección de campo de los motores en determinados puntos temporales. Supongamos que se han recopilado los datos de inspección de 12 motores en el campo para analizar el inicio del tiempo hasta la rotura de un componente en particular. En este ejemplo, “falla” se define como una grieta que se inicia en una ubicación crítica particular, y se supone que el modo de falla es impulsado por el número de arranques del motor. Cuando se inspeccionan los motores en el campo para recopilar datos sobre el inicio del tiempo hasta la rotura, es posible que la indicación de rotura no esté presente en un punto de inspección determinado, sino en el siguiente punto de inspección. Es decir, el tiempo real en que se produjo el inicio se encuentra entre los dos puntos de inspección.
Supongamos que hay 12 motores en el campo y cada motor se inspecciona después de seis arranques, con un límite de vida útil de 24 arranques. Dos motores que se inspeccionaron a los 18 arranques tenían indicios de rotura. Sin embargo, no se encontraron indicios después de 12 arranques. Por lo tanto, el tiempo en el que se inicia la grieta es entre los 12 y los 18 arranques. Por lo tanto, el inicio del tiempo hasta la rotura para ambos motores se registra en el intervalo [12, 18].
Tabla 1 — Datos de inspección de motores.
Un conjunto de datos en particular puede contener uno, dos o los tres tipos de datos censurados. Los datos de inspección de motores son un ejemplo que contiene los tres tipos de censura. De hecho, en este ejemplo, todos los datos son censurados ya que las inspecciones se realizan en puntos fijos, espaciados a partes iguales en el tiempo. Por lo tanto, la información exacta a lo largo del tiempo nunca se conocerá.
Ya se ha ilustrado un ejemplo de dos motores con datos censurados por intervalos para los datos de inspección de motores. Supongamos que un motor tuviera indicios de rotura durante la primera inspección en seis arranques. Todo lo que se sabe es que la grieta se inició algún tiempo antes (o a la izquierda) de los seis arranques. De este modo, el tiempo de inicio de la grieta se registra como [0, 6].
Figura 1 — Gráfico de datos de inspección de motores.
Supongamos que los nueve motores restantes llegaron al límite de vida útil de 24 arranques sin ningún indicio de rotura. Por lo tanto, el tiempo que una grieta podría iniciarse es después (o a la derecha) de 24. Así, la respuesta para los motores restantes se registra como (24, ∞). La tabla 1 muestra los datos de la inspección ficticia de motores. La figura 1 muestra un gráfico de los datos censurados a la derecha, a la izquierda y por intervalos.
Para los ejemplos de curva de propiedades del material y probabilidad de detección por corrientes de Foucault (EC POD), el análisis de regresión se utiliza normalmente para analizar los datos. Los métodos de regresión tradicionales utilizan el método de mínimos cuadrados, que supone que todos los valores de respuesta se conocen exactamente, para estimar los parámetros del modelo de regresión. Si se utilizan métodos de regresión tradicionales, entonces los datos censurados en la curva de propiedades del material y los ejemplos de EC POD tendrían que excluirse completamente del análisis o debería asignárseles algún valor (por ejemplo, a los puntos de datos censurados en el ejemplo de la curva de propiedades del material se les asignaría el número máximo de ciclos permitidos en el experimento). Tratar los datos censurados de esta manera puede conducir a resultados seriamente engañosos. Debido a que los datos censurados se encuentran comúnmente en estas aplicaciones, se utiliza el método de máxima verosimilitud para estimar los parámetros del modelo de regresión.
El método de máxima verosimilitud es una técnica de regresión más avanzada para estimar los parámetros del modelo y es necesario para el tratamiento adecuado de los datos censurados. En general, el método de máxima verosimilitud se considera un método más versátil para ajustar un modelo a los datos, ya que puede aplicarse a una amplia variedad de tipos de datos, incluidos los datos censurados, así como a una amplia variedad de modelos estadísticos [1]. Cabe señalar que los valores de los parámetros del modelo que se utilizan en el método de máxima verosimilitud son los mismos que los obtenidos con el de los mínimos cuadrados cuando no se dispone de datos censurados [2].
El no tratar correctamente los datos censurados puede tener un impacto significativo en un modelo de regresión, lo que puede generar un modelo deficiente y predicciones engañosas. (Para obtener más información sobre el análisis POD para corrientes de Foucault cuando hay datos censurados, consulte la práctica para el análisis de probabilidad de detección para datos “â versus a”, E3023, y la referencia 3).
En resumen, es fundamental identificar y clasificar adecuadamente los puntos de datos censurados —si tales datos censurados están presentes— para obtener el máximo de información de los datos y evitar resultados de análisis erróneos y engañosos. Seleccionar el método de análisis estadístico apropiado para manejar adecuadamente los datos censurados también es clave.
REFERENCIAS
1. Meeker, W. Q., and Escobar, L. A., Statistical Methods for Reliability Data, John Wiley and Sons, New York, 1998.
2. Neter, John, Kutner, M.H., Wasserman, William, and Nachtsheim, C. J., Applied Linear Statistical Models, 4th Ed., The McGraw-Hill Companies Inc., 1996.
3. Herberich Brown, J., “Probability of Detection Analysis for Eddy Current Inspection Systems,” ASNT Fall Conference and Quality Testing Show, Columbus, Ohio, 2009.
Jennifer Brown trabajó como estadística en la industria aeroespacial durante más de 12 años. Es miembro de ASTM International desde 2010, miembro del comité de calidad y estadística (E11), presidenta del subcomité de terminología (E11.70) y miembro del subcomité de métodos especializados no destructivos (NDT) (E07.10).
John Carson, Ph.D., estadístico sénior de Neptune and Co., es el coordinador de columnas de Puntos de datos. Es presidente del subcomité de control de calidad estadístico (E11.30), miembro del comité de calidad y estadísticas (E11) y miembro de los comités de productos a base de petróleo, combustibles líquidos y lubricantes (D02), calidad del aire (D22), cannabis (D37) y evaluación ambiental, gestión de riesgos y acción correctiva (E50).