Diseño de experimentos: ¿por qué? ¿Y por qué no?

POR:
Author
Katie Daisey

P.: En general, comprendo el proceso de ejecutar un diseño de experimento (Design of experiment, DOE), pero ¿por qué debería hacer uno?

R.: En primer lugar, para nuestros lectores que no están familiarizados con él, un DOE es un procedimiento en el que se obtienen datos utilizando técnicas estadísticas sólidas a partir de combinaciones específicas de variables controladas. A su vez, los datos se utilizan para construir un modelo matemático que predice el resultado de todas las combinaciones posibles de esas variables (dentro de un rango razonable). Esto a menudo se contrasta con el proceso iterativo estándar o "aristotélico", aunque nada impide que un experimentador ejecute DOE secuenciales para obtener información más específica.

La mayoría de los DOE son experimentos factoriales completos o parciales. En un DOE factorial, el experimentador determina primero qué variables (o factores) querría estudiar. Luego determina cuántos niveles diferentes, como alto/medio/bajo, se debe observar dentro de cada factor. A continuación, efectúa un experimento para todas las posibles combinaciones de factores (factorial completo) o algún conjunto de combinaciones definido a propósito (factorial parcial) al azar. Finalmente, le da todos esos datos a un estadístico, quien los analiza y devuelve un modelo mágico que le dice al experimentador qué factores importan, la magnitud de sus efectos y los niveles que debe usar para obtener los mejores resultados.

¿Por qué no un DOE?

Antes de describir por qué se debe utilizar un DOE, consideremos en qué situaciones no es necesario.

La primera situación es cuando un experimentador está muy familiarizado con el proceso y comprende bien las razones subyacentes de por qué y cómo cada factor afecta el resultado final. En vez de usar un DOE para formular un modelo matemático a fin de comprender el espacio experimental, el experimentador, generalmente a través de años de experiencia, crea un modelo interno.

La segunda situación es cuando los experimentos son rápidos, económicos y fáciles de ejecutar (o cuando hay una gran cantidad de datos históricos). En vez de usar un DOE, es más fácil ejecutar suficientes experimentos para cubrir por completo el espacio experimental. (Un experimentador cuidadoso verificaría primero cualquier dato histórico para asegurarse de que no se hayan omitido combinaciones posibles, que no haya correlación con una variable oculta y que, por lo demás, sea adecuado).

La tercera situación es cuando los experimentos son peligrosos y solo se pueden realizar de manera segura cambios pequeños. El experimentador solo puede realizar una serie de pequeños incrementos para optimizar el proceso. De hecho, existe un tipo de DOE específico para esta situación: una optimización simplex. El experimentador ejecuta un pequeño conjunto de experimentos en la región de "condiciones normales de funcionamiento" y aplica una fórmula matemática para calcular dónde se debe ejecutar el siguiente experimento, con solo un pequeño incremento fuera de lo "normal". El resultado de este experimento se agrega a la fórmula para calcular el siguiente pequeño incremento, y así sucesivamente

¿Por qué DOE?

Una de las principales razones por las que los experimentadores eligen, quizás imprudentemente, no utilizar un DOE, es la percepción de un mayor número de experimentos a realizar en comparación con su trabajo normal. Sin embargo, un DOE proporciona matemáticamente la mayor cantidad de información con la menor cantidad de experimentos. Los experimentos que parecen infructuosos son necesarios para proporcionar explicaciones de todo el proceso.

La percepción de que un DOE requiere mucho más trabajo preparatorio que los experimentos tradicionales, a menudo se debe a que este trabajo necesario se realiza por separado o, lamentablemente, se considera opcional.

Por ejemplo, un estadístico podría preguntarle a un experimentador sobre el error en su sistema de medición, ya que esta información es fundamental para determinar la relación señal/ruido, qué tan grande será el error en las predicciones y cuántas repeticiones deben cumplimentarse. Si nunca se ha realizado un estudio de repetibilidad y reproducibilidad del medidor u otro análisis del sistema de medición (o si ha pasado cierto tiempo desde su realización), puede parecer que se trata de trabajo adicional que solo se requiere para un DOE en lugar de análisis habituales. O un estadístico podría querer saber qué variables tienen más probabilidades de interactuar entre sí, y si el resultado va a ser lineal o polinómico. Estas preguntas requieren cierta comprensión del proceso, un diagrama del proceso y quizás algunos experimentos preliminares.

Una de las ventajas de un DOE es la capacidad de aleatorizar los experimentos, lo que no es posible con experimentos tradicionales. Aunque se tenga mucho cuidado y se gaste lo que fuera necesario para controlar tantas variables ambientales como sea posible, rara vez se puede controlarlo todo. En experimentos no aleatorizados, no es posible separar los cambios debidos a variables ambientales de los cambios debidos a variables independientes.

La segunda ventaja clave de un DOE es la comprensión de la totalidad del sistema que se está estudiando. Es raro que un experimentador solo se preocupe por optimizar una única variable objetivo. Con mayor frecuencia, se optimizan varias variables objetivo y, por lo general, las decisiones sobre cómo deben priorizarse los objetivos son complicadas. Puede haber varias combinaciones aceptables de las variables objetivo, o ninguna, y solo la exploración de todo el espacio con una resolución adecuada encontrará esa información. El modelo matemático también se puede volver a utilizar en el futuro si hay un cambio en el resultado deseado de las variables objetivo. Además, aunque no es imposible con la experimentación tradicional, es mucho más fácil encontrar y cuantificar la manera en que las interacciones entre variables influyen sobre el resultado. La optimización de una variable independiente a la vez, como lo haría uno intuitivamente, hace que sea extremadamente difícil manejar las interacciones. Finalmente, la información en todo el espacio de estudio puede ayudar a fundamentar el cambio de un modelo matemático empírico a un modelo causal mecanicista.

La tercera ventaja de un DOE, que a menudo se subutiliza, es la capacidad de analizar la varianza de un proceso en todo el espacio. Es importante saber si la varianza del proceso es constante. Un DOE bien diseñado con repeticiones puede permitir una separación de varianza estadísticamente significativa, mientras que un tratamiento ingenuo podría dejar inseguro al experimentador. Más importante aún, examinar la varianza del sistema proporciona detalles sobre la sensibilidad del proceso, no solo cómo los diferentes factores controlados afectan el resultado, sino cómo los factores no controlados pueden tener un efecto mayor con un conjunto de puntos de ajuste en comparación con un conjunto diferente. Tenga en cuenta que este es un procedimiento separado del uso de un DOE para determinar la robustez, donde los posibles mecanismos de falla se eligen como factores controlados.

Si bien no todas las situaciones requieren un DOE, el ahorro de tiempo, la información sobre una gama más amplia de condiciones y la comprensión de la incertidumbre son ventajas importantes a considerar. (Obtenga más información sobre el DOE en las obras que se indican a continuación).

Katie Daisey es una científica (quimiometrista) de Arkema Inc. Miembro de ASTM International desde 2018, es secretaria de registro del Comité sobre Calidad y estadística (E11).

El Dr. John Carson, estadístico sénior de Neptune and Co., es el coordinador de la columna Data Points. Es miembro del Comité sobre Calidad y estadística (E11) y miembro de los Comités sobre Productos derivados del petróleo, combustibles líquidos y lubricantes (D02), Calidad del aire (D22) y Evaluación ambiental, gestión de riesgos y acciones correctivas (E50).

Referencias

1. Montgomery, D.C., Design and Analysis of Experiments, Wiley, Hoboken, New Jersey, 2019.

2. Cox, David, and Reid, Nancy, The Theory of the Design of Experiments, Chapman & Hall/CRC, Boca Raton, Florida, 2000.

3. NIST/SEMATECH, Engineering Statistics Handbook, April 2012, doi.org/10.18434/M32189. 

4. Bezerra, M.A., et al., “Simplex Optimization: A Tutorial Approach and Recent Applications in Analytical Chemistry,” Microchemical Journal, Vol. 124, 2016, pp. 45–54

Issue Month
Enero/Febrero
Issue Year
2022
COMITÉ:
Committees
E11