¿Puede un promedio móvil de los datos ser engañoso?
P: A veces, quiero obtener un promedio móvil de mis datos para reducir el ruido percibo, pero ¿realmente puedo engañarme a mí mismo?
R. Un promedio móvil o media móvil de un conjunto de datos tomado en secuencia temporal se obtiene a partir del promedio de las primeras observaciones k, al que se le resta el primer valor (más antiguo) y al que se le suma el valor más reciente (más nuevo) para obtener el promedio siguiente. Probablemente, este es el procedimiento más sencillo y más común para pulir datos con el objeto de reducir el nivel de ruido.
Considere un conjunto de observaciones en orden cronológico ,, …, que puede ser dividido de esta manera en promedios móviles consecutivos de tamaño del tramo k.
se divide en ventanas móviles de puntos k
el promedio de cada ventana de puntos k da como resultado los promedios móviles n-k+1
El objetivo del promedio móvil es simplemente nivelar las fluctuaciones periódicas en un conjunto de datos de una serie cronológica. Si los datos contienen un ciclo de amplitud y período constantes, el promedio móvil puede eliminarlo. Comencemos con un ejemplo sencillo. Los siguientes datos representan el resultado de un proceso que se extiende de lunes a viernes durante un mes, donde las comas separan los días, y los puntos y coma separan las semanas:
Semana |
L |
M |
X |
J |
V |
1 |
3, |
2, |
1, |
1, |
2; |
2 |
3, |
2, |
1, |
1, |
2; |
3 |
3, |
2, |
1, |
1, |
2; |
4 |
3, |
2, |
1, |
1, |
2 |
A continuación, encontramos que el uso de k = 5 días (una semana) de nuestro promedio móvil da como resultado un promedio de 1.8 para la primera semana. Al restar el valor 3 del primer lunes y sumar el valor 3 del segundo lunes, se obtiene como resultado 1.8 para el siguiente promedio móvil. En la tabla 1, se muestran todos los promedios móviles de este conjunto de datos. Dado que el ciclo no cambia de una semana a la otra y la duración utilizada para el tramo del promedio móvil (5) es igual a la duración del ciclo de 5 días (una semana), el promedio móvil sigue siendo un valor constante. Por lo tanto, el efecto cíclico ha sido eliminado.
Entonces, ¿cómo un promedio móvil puede resultar engañoso en algunas ocasiones? Obviamente, no se esperaría que el típico conjunto de datos exhibiera la naturaleza coherente que se observa en nuestro simple conjunto de datos. Con frecuencia, veremos una variación adicional agregada a algunos efectos cíclicos. En consecuencia, solo es necesario realmente abordar el componente aleatorio de esta variación. En otras palabras, calcular un promedio móvil debe dar un resultado por el que una parte sea un promedio móvil del componente aleatorio de variación de la variación total.
Esto nos conduce al problema en relación con los promedios móviles. Los promedios móviles sucesivos de valores k tendrán valores k - 1 en común. Esto significa que estarán correlacionados de manera positiva y que el grado de correlación aumentará a medida que k se incremente. En otras palabras, mientras mayor sea k, los promedios móviles consecutivos tendrán más datos en común y estarán más positivamente correlacionados, y los datos se verán más uniformes (menos variables). Sin embargo, esta secuencia de valores positivamente correlacionados formará un patrón de oscilación. Esto significa que una serie de promedios móviles que elimina la variación cíclica mostrará todavía oscilación debido a la presencia de variación aleatoria. No deseamos ser engañados por este patrón de oscilación como si representase un fenómeno real.
Observemos un ejemplo que ilustra este escenario.
Ejemplo
Supongamos que generamos 200 números normales aleatorios con una media de 0 y una desviación estándar de 1. Los estadistas se refieren a dichos números aleatorios como pertenecientes a una distribución normal estándar. Formaremos promedios móviles de k = 5, k = 10 y k = 25. En la figura 1a, se muestra un gráfico de valores aleatorios individuales. En las figuras 1b y 1c, se muestran los promedios móviles de k = 5 y k = 10.
Recuerde que, si bien los datos individuales representan valores aleatorios sin las tendencias aparentes que se observan en la figura 1a, en estas dos figuras se muestra lo que parece ser una fluctuación que puede resultar engañosa si el usuario intenta explicar el patrón. Por supuesto, las personas que son buenas para generar explicaciones no tienen problemas al momento de interpretarlas. Para el momento en que ampliemos el promedio móvil a k = 25 puntos, los datos se habrán vuelto tan uniformes que habrá poco para observar. Como se podía esperar, el gráfico se vuelve más uniforme a medida que k aumenta, ya que se produce la correlación positiva entre los promedios móviles.
Se debe enfatizar que los datos de este último ejemplo son parte de un sistema; estable que representa la variación aleatoria sin influencias externas. No todos los conjuntos de datos son como este en la práctica, ya que contienen alguna cantidad de variación no normal. De esta manera, el uso de promedios móviles en cualquier conjunto de datos exige que el usuario considere en qué medida necesita volver los datos uniformes; por ejemplo, cuál es el valor apropiado de k que debe utilizarse. Una buena regla general es la siguiente: si usted sabe que desea volver uniforme el tipo de variación observada en los puntos k, entonces utilice un promedio móvil de puntos k. Si está trabajando con un proceso, entonces considere la dinámica del proceso. Si el proceso no cambia demasiado dentro de los puntos k, es decir, es una variación esencialmente aleatoria, use entonces un promedio móvil de puntos k.
No permita que los promedios móviles lo engañen y o hagan ver algo que no está allí realmente. Para obtener más información acerca de los métodos básicos de gráficos de control, incluidos los gráficos de promedios móviles ponderados exponencialmente, consulte la norma E2587, Práctica para el Uso de Gráficos de Control en el Control Estadístico de Procesos y el Manual 7, Manual on Presentation of Data and Control Chart Analysis (Manual sobre Presentación de Datos y Análisis de Gráficos de Control), octava edición.
Dean V. Neubauer, Corning Inc., Corning, Nueva York, es miembro de ASTM International; presidente del Comité E11.90.03 sobre Publicaciones y coordinador de la columna Data Points; anteriormente, Neubauer fue presidente del Comité E11 sobre Calidad y Estadísticas.