Plans d'expériences et simulation Monte-Carlo

Comment améliorer un processus avec des données simulées ?

Anticiper les défis est toujours une tâche ardue pour les professionnels de l’amélioration continue. Des inefficacités imprévues dans les processus ou des défauts dans le développement de produits peuvent bouleverser les délais et les coûts associés. Comment s’engager sur des prévisions et des délais réalistes lorsque les ressources sont limitées ou que la collecte de données réelles est trop coûteuse ou peu pratique ?

C’est à ce moment que la simulation Monte-Carlo entre en jeu. Les simulations Monte-Carlo peuvent aider à prévoir avec précision et en peu de temps le vaste éventail de résultats possibles de vos processus.

Simuler les données est en pratique couramment utilisé dans les situations où les ressources sont limitées ou lorsque la collecte de données réelles serait trop coûteuse ou peu pratique. La simulation Monte-Carlo est une technique de modélisation mathématique qui permet de voir tous les résultats possibles et d’évaluer les risques pour prendre des décisions basées sur les données.

La méthode Monte-Carlo utilise un échantillonnage aléatoire répété pour générer des données simulées à utiliser avec un modèle mathématique. Ce modèle provient souvent d’une analyse statistique et notamment d’un plan d’expériences.

Supposons que vous étudiez un processus et que vous utilisiez le modèle suivant issu de l’analyse d’un plan d’expériences :

strength = -80,5651 + 0,392903*sealing temperature + 1,43027*cooling bar temperature + 8,70648*polyethelene – 0,000842513*sealing temperature^2 – 0,0129141*cooling bar temperature^2 – 3,18461*polyethelene^2

Avec ce type de modèle, vous pouvez entrer les valeurs des variables explicatives (facteurs) du processus dans l’équation et prévoir la sortie du processus (réponse).

Concevoir un meilleur processus tout en tenant compte de l’incertitude

Pour concevoir un meilleur processus, vous pouvez collecter une montagne de données afin de déterminer comment la variabilité de la réponse est liée à la variabilité des facteurs dans diverses conditions. Si vous connaissez la distribution des facteurs et que vous avez une équation qui modélise le processus, vous pouvez facilement générer une grande quantité de valeurs simulées des facteurs et les entrer dans l’équation du processus pour produire une distribution simulée de la réponse.

Vous pouvez également modifier facilement les distributions des facteurs pour répondre aux questions « et si ». C’est à cela que sert la simulation Monte-Carlo.

(d’après Quality Magazine ‘Understanding Monte Carlo Simulation’)

Plans d’expériences et simulation Monte-Carlo dans Statgraphics Centurion

Statgraphics Centurion permet la création et l’analyse de nombreux types de plans d’expériences. Couplé aux procédures de simulation Monte-Carlo présentes dans le logiciel, il est possible de générer aisément et rapidement un grand ensemble d’expériences numériques analysant les évolutions de la réponse suite :

  1. Aux variations des facteurs expérimentaux dans le domaine expérimental d’étude (première simulation)
  2. A la prise en compte des imprécisions sur les mesures des facteurs expérimentaux (deuxième simulation)
  3. A la prise en compte des erreurs sur les coefficients estimés du modèle élaboré (troisième simulation)

Divers graphiques des valeurs simulées pour la réponse peuvent alors être affichés pour aider à trouver les plages des facteurs expérimentaux permettant d’avoir un processus apte.

Pour illustrer ces analyses, nous reprenons l’exemple du plan en surface de réponse décrit dans le document PDF nommé « Assistant pour les plans d’expériences – Surface de réponse » et disponible dans le StatFolio « RSM.sgp ». Quelques modifications ont été apportées au StatFolio d’origine.

Myers et Montgomery (1995) y décrivent un exemple typique d’une expérimentation mise en œuvre pour optimiser la force de rupture (strength) d’emballages pour le pain. Le plan utilise la réponse et les facteurs expérimentaux décrits ci-dessous avec les plages associées de variation :

Le domaine expérimental de l’étude est donc :

A             de 225 à 285

B             de 46 à 64

C             de 0,5 à 1,7

La limite de spécification inférieure (LSI) pour la réponse est ‘Bas’ = 8.

La matrice expérimentale des 20 essais (plan centré composite: 2^3 + étoile) et les valeurs de la réponse sont affichées ci-dessous :

Après dépouillement du plan et élimination des effets non significatifs, le diagramme de Pareto suivant est obtenu :

Le modèle résultant dans les unités d’origine est :

strength = -80,5651 + 0,392903*sealing temperature + 1,43027*cooling bar temperature + 8,70648*polyethelene – 0,000842513*sealing temperature^2 – 0,0129141*cooling bar temperature^2 – 3,18461*polyethelene^2

L’optimisation déterministe par Statgraphics Centurion dans le domaine expérimental donne les résultats suivants :

Première simulation Monte-Carlo

Fichiers StatFolios et données : MC1.sgp, MC1.sgd, MC2.sgp, MC2.sgd

Dans cette première simulation, il s’agit d’étudier l’aptitude du processus dans le domaine expérimental de l’étude. Nous analyserons donc les évolutions de la réponse en fonction des variations des facteurs expérimentaux dans ce domaine expérimental.

Pour tous les détails sur la mise en œuvre des simulations Monte-Carlo, voir le document PDF intitulé ‘Simulation Monte Carlo (Modèles généraux)’ livré avec Statgraphics Centurion.

Dans Statgraphics Centurion, ouvrir le menu ‘Outils – Simulation Monte Carlo – Modèles généraux de simulation’, définissons notre simulation :

N’ayant pas d’information particulière sur les distributions des facteurs A (sealing temperature – température de scellage), B (cooling bar temperature – température de la barre de refroidissement) et C (polyethelene – polyéthylène), nous sélectionnons pour chacun une loi uniforme continue dans les plages du domaine expérimental.

Pour la variable Réponse, nous entrons l’équation du modèle obtenu par le plan d’expériences :

-80,5651 + 0,392903*A + 1,43027*B + 8,70648*C – 0,000842513*A^2 – 0,0129141*B^2 – 3,18461*C^2

A noter que l’erreur totale du modèle n’est pas prise en compte dans cet exemple (R2 = 0,81).

Par les options d’analyse, nous précisons la taille de l’échantillon aléatoire à générer et la racine pour le générateur de nombres aléatoires :

Cliquons sur OK pour exécuter la simulation. Après quelques instants, nous obtenons les résultats suivants :

L’asymétrie standardisée de la réponse indique que sa distribution ne suit pas une loi normale.

Les histogrammes des facteurs A, B et C montrent que les lois uniformes demandées sont globalement respectées. Dans cet exemple, nous n’avons effectué que 5000 tirages aléatoires. Faire plus de tirages donnerait un meilleur ajustement.

L’histogramme de la réponse affiche clairement l’asymétrie de sa distribution.

Effectuons une analyse d’aptitude sur les données simulées de la réponse par le menu ‘MSP – Analyse d’aptitude – Variables- Données individuelles’.

La spécification inférieure pour la réponse est ‘Bas’ (LSI) = 8.

La distribution de la réponse n’étant pas normale, par les options d’analyse nous optons pour une transformation de Johnson qui permettra de normaliser les données.

Visualisons le graphique et les indices d’aptitude :

La valeur de l’indice Ppk est de 0,35 ce qui est bien en-dessous des valeurs habituellement acceptées et caractérise donc un processus non apte dans le domaine expérimental de l’étude. Environ 15 % des réponses obtenues par la simulation sont au-dessous de la spécification.

De plus, la valeur de l’indice d’aptitude non-normale Ppk(q), obtenu en utilisant les courbes de Pearson, est de 0,37 et confirme que le process sus n’est pas apte.

Il convient donc de diminuer le nombre de défauts en réduisant la variabilité de la réponse due aux fluctuations des facteurs. Plusieurs solutions sont possibles :

  1. Rechercher des données historiques concernant les facteurs pour ajuster des lois possiblement plus adéquates que les lois uniformes,
  2. Utiliser pour les facteurs les lois suggérées par la physique sous-jacente du processus,
  3. Calculer les corrélations des rangs entre les facteurs A, B, C et la réponse pour comprendre quels sont les facteurs les plus influents.

Dans cet exemple, le facteur A est le plus influent (négativement) sur la réponse puis le facteur C (positivement). Le facteur B n’a lui quasiment pas d’effet sur le réponse et les corrélations entre les facteurs A, B et C sont quasi-nulles.

En s’appuyant sur les connaissances des analystes, définissons de nouvelles plages de variation des facteurs A (diminution de sa borne supérieure) et C (augmentation de sa borne inférieure) :

A             de 225 à 260       au lieu de 225 à 285

C             de 0,7 à 1,7         au lieu de 0,5 à 1,7

Le graphique d’aptitude obtenu affiche alors un Ppk de 1,23, un DPM long-terme de 118 (0,012% hors spécification) et la valeur de l’indice d’aptitude non-normale Ppk(q) est de 1,08.

Le domaine d’exploitation retenu est donc :

A             de 225 à 260

B             de 46 à 64

C             de 0,7 à 1,7

Cette première simulation nous a permis, sans devoir effectuer de nombreuses nouvelles expériences, de valider un domaine d’exploitation dans lequel le processus est apte.

Deuxième simulation Monte-Carlo

Fichiers StatFolios et données : MC3.sgp, MC3.sgd

Dans cette deuxième simulation, il s’agit d’étudier l’aptitude du processus dans le domaine expérimental de l’étude suite à la prise en compte d’imprécisions dans les mesures des facteurs expérimentaux.

Nous supposerons que les facteurs suivent chacun une loi normale avec les paramètres suivants :

Définissons notre simulation Monte-Carlo puis cliquons sur OK pour exécuter la simulation.

Les distribution des facteurs A, B et C suivent approximativement les lois définies et le graphique de la réponse affiche un Ppk et un DPM long-terme satisfaisants.

Les imprécisions définies sur les facteurs ne perturbent donc pas l’aptitude du processus.

Troisième simulation Monte-Carlo

Fichiers StatFolios et données : MC4.sgp, MC4.sgd

Dans cette troisième simulation, il s’agit d’étudier l’aptitude du processus dans le domaine expérimental de l’étude suite à la prise en compte simultanée des imprécisions sur les mesures des facteurs expérimentaux et des erreurs sur les coefficients estimés du modèle élaboré.Dans cet exemple, nous avons volontairement décomposé en termes simples les expressions des calculs de notre simulation Monte-Carlo :

Les paramètres des lois pour les facteurs A, B et C sont identiques à ceux de notre première simulation.

Les effets estimés du plan d’expériences sont affichés ci-dessous et le nombre de degrés de liberté est égal à 13.

A chaque effet du modèle, nous ajoutons un élément d’incertitude basé sur la loi de Student à 13 degrés de liberté. Ce sont les colonnes intitulées EffMoy, EffA, EffB, EffC, EffAA, EffBB et EffCC.

Statgraphics Centurion affiche les valeurs des effets complets. Pour notre simulation, nous devons calculer les effets moyens (la colonne Effet moyen est égale à moitié des effets calculés par Statgraphics Centurion sauf pour la moyenne) car ces effets moyens correspondent aux coefficients standardisés de notre modèle de régression.

Ces éléments de notre modèle ayant été calculés par rapport aux facteurs normés [ -1 ; +1 ], il convient de définir le domaine de variation normé. Ce sont les colonnes intitulées DomaineA, DomaineB, DomaineC, DomaineAA, DomaineBB et DomaineCC.

La colonne Réponse contient les valeurs issues de l’équation du modèle exprimée en fonction des variables de la simulation.’analyse d’aptitude basée sur le domaine expérimental d’étude nous indique que le Ppk est égal à 0,24 ce qui est très insuffisant !

La prise en compte des erreurs sur les coefficients du modèle estimé (R2 = 0,81) rend le processus non apte.

Une étude approfondie du domaine expérimental doit donc être menée.

Note : les fichiers utilisés, au format Statgraphics Centurion 19, peuvent être obtenus sur simple demande.