什麼是DOE?怎麼做DOE分析?

终身美丽 2024-09-08 11:00 7次浏览 0 条评论 taohigo.com

一、前言

DOE(Design of Experiments)是一種實驗設計方法,用於探索和驗證因素對結果的影響。在DOE中,通常會將實驗分為多個組合,每個組合都會控制一個因素,並測量其對結果的影響。通過這種方式,可以更全面地瞭解因素對結果的影響,並確定最佳因素組合。

下面是DOE的基本步驟:

①確定實驗目標和因素:確定實驗的目標和要探索的因素。這些因素可以是自變量,也可以是因變量。

②設計實驗設計:根據實驗目標和因素,設計實驗方案,包括對比組、試驗處理、因素水平等。

③選擇試驗處理:選擇適當的試驗處理方法,包括平行組、重復組等。

④進行試驗:按照設計好的實驗方案進行試驗,並記錄數據。

⑤分析數據:對試驗數據進行分析,包括統計方法、圖表制作等。

⑥得出結論:根據分析結果,得出關於因素對結果影響的結論。

⑦優化實驗設計:根據結論和實驗數據,優化實驗設計,以提高實驗的準確性和可靠性。

⑧重復實驗:在得出結論後,重復進行實驗,以驗證結論的準確性和可靠性。

著名DOE專傢喬治·博克斯說:“如果能使我們的工程師開始學習運行一個簡單的實驗,將會極大地刺激他們的胃口。哪怕這是他們唯一掌握的數據驅動的方法,也將極大提升實驗的效率、創新的速率以及整個國傢的競爭力。”

二、怎樣學習本課程

DOE是一門復雜的高級統計技術,瞭解基本的統計知識是必要的;

課程提供瞭詳實清晰的實現DOE的路線圖和說明,你必須瞭解其中的要求和準則;

以探究和互動的方式來推動學習,提倡多提問,但不是質疑統計學以及應用準則,你可問“為什麼”?

帶著問題學習,最好能事行準備工廠數據到課堂來討論;

攜帶電腦,安裝MINITAB——以幫助學員進行DOE計算與建立分析模型,並加深統計學原理,解決實際問題。

三、課程設置

第一單元 實驗設計原理

第二單元 正交實驗設計與Minitab

第三單元 全因子實驗設計

第四單元 部分因子實驗設計

第五單元 響應曲面實驗設計

第六單元 篩選實驗設計

第七單元 DOE歸納與提升

第一單元 實驗設計原理

1、引言

制程中復雜的自變量X與輸出響應Y是怎樣地發生作用的?哪些X對Y影響大?哪些對Y影響小?

制程參數應如何設定才能獲得最理想的過程輸出Y的最佳值?

長期的品質問題得不能解決,同類質量問題反復發生,原因到底是什麼?有什麼可行的方法能夠解決企業質量問題的“頑疾”?

答案是肯定的,那就是DOE。

2、什麼是DOE

DOE:Design of Exprements 實驗設計,在質量控制的整個過程中扮演瞭非常重要的角色,它是改進產品質量、產品設計開發和工藝流程改善的重要工具。

實現設計由於其強大有效的功能,已廣泛運用於冶金、制造、化工、電子、醫藥、食品等行業,直至航天業。

3、實驗設計定義

它是一種安排實驗和分析實驗數據的數理統計方法。

計劃安排一批試驗,並按照計劃在設定的條件下進行這些試驗,通過改變過程的輸入變量,獲得新數據,然後對之進行分析,獲得我們所需要的信息,從而得出科學的結論,並據此作出合理有效的決策。

4、DOE發展的三個裡程碑

1920年,實驗設計技術最早是由英國統計學大師費歇爾(R.A.Fisher)所創立,首先將其應用在農業試驗,目的是為提高農業產量。

1947年印度的勞博士(Rao,D,R)發明並建議使用正交表規劃具有數個參數的實驗計劃。

英國統計學傢喬治·博克斯(George Box)發展瞭響應曲面方法(RSM),使得DOE的應用步入一個黃金時代。

二戰後,日本質量管理大師田口玄一研究開發出“田口品質工程方法”,簡稱田口方法。從而極大提升瞭日本產品品質及日本產業界的研發設計能力,成為日本質量管理最重要的工具。

5、檢測復雜的因果關系

實驗設計是檢測、篩選、證實原因的高級統計工具,是利用整個統計領域的知識來理解流程中普遍存在的復雜關系。

它不僅能識別單個因素影響,而且能識別多個因子的交互影響。

DOE通過安排最經濟的試驗次數來進行試驗,以確認各種因素X對輸出Y的影響程度,並且找出能達成品質最佳因子組合。

DOE是進行產品和過程改進最有效的強大武器!

6、傳統實驗的致命弱點

原來大學教授傳授一種試驗方法,至今仍被傳統的工程師所沿用。在這種老式的試驗中,一次隻有一個變量變動,而其他變量均保持恒定。

①試驗周期過長,需要花費大量時間和金錢;

②致命弱點是不能把主效應從交互效應中分離開;

③結果是不斷受挫折、惡性循環和增加成本。

7、DOE的優勢

①可同時變動和測試多個變量的影響;

②實驗次數少 L8(2^7)=128次(全部組合);

③效果最好最可靠;實驗周期最短;成本最低。

8、實驗設計三項基本原則

1)重復設計

概念:一個處理施於多個單元。簡單講,就是指相同的試驗條件需要重復進行2次或以上的實驗。

作用:估計隨機誤差

常用的策略是采用中心點。

——————————

2)隨機化

概念:以完全隨機的方式安排試驗的順序。

目的:防止出現系統差異的影響。

——————————

3)區組化

概念:一組同質齊性的實驗單元(運行)稱作一個區組,將全部實驗單元劃分為若幹區組的方法稱為區組化。

作用:區組也是一個變量因子,使實驗分析更為有效。

例子:上午與下午有差異、跨度很長的時間分段……

9、實驗設計基本目標

1)篩選

目的:檢測因子(自變量)對響應Y的影響程度——祛除非顯著因子,保留顯著因子。

方法:篩選設計、分部設計

——————————

2)分析

目的:特征化處理,檢測因子的主效應和交互作用,建立Y對X的關系式——回歸方程。

方法:2^k析因設計

——————————

3)優化

目的:尋找“最佳區域”,確定使響應Y值最佳時X的設置條件(因子水平的最佳組合)

方法:響應曲面設計RSM

10、DOE應用范圍

①新產品研制開發;

②產品設計參數優化;

③為產品選擇最合理的配方;

④過程設計與優化,尋找最佳生產條件;

⑤提高老產品質量或產能;

⑥用於質量改進,解決長期質量問題。

11、DOE基本術語

1)實驗計劃

它是實驗中產生結果的一項經濟有效的方法。

實驗設計是一項安排,以便於實驗的進行。而實驗則是一項研究方法,擇定數項獨立變量做隨機變動,從而確定其效應。一項良好的實驗,可以使實驗的結果獲得簡明的解釋,可以確定各項因素的主效應,也可據此確定各個因素間的交互作用。

一般情況下,實驗計劃由正交表實現。

3因子2水平實驗計劃表(比如+表示是、正確等,-表示非、錯誤等)

——————————

2)響應

響應:亦稱指標、質量特性,是在實驗設計中可以測量的系統輸出,一般以Y表達。

輸出響應Y可以是計量型指標和計數型指標兩種表達方式。

——————————

3)因子與水平

因子:指系統或過程輸入變量。是工程師需要研究或設定的對象,借以說明響應的大小。

因子有兩種分類方法:

定性因子的水平被限制為個數,沒有什麼固定順序,如操作者或材料等;

定量因子則可取連續值(如溫度、壓力)的因子。

水平:在進行每一次實驗時,每一因子至少應從兩個層次進行研究,稱其為因子的水平。例如溫度可能其應用的范圍是210℃~230℃,這兩個值可以作為因子溫度的水平。

重要提示:因子的水平數至少應取2個

表達方式:

若為2個水平:高水平+1;低水平-1;

若為3個水平:由低到高,依次用1、2、3表達。

——————————

4)主效應與交互作用

主效應:一個因素對輸出響應的影響。

交互作用:兩種或以上的因素共同對輸出響應值的影響。

因子的交互作用:一文輕松看懂交互作用。

12、如何選擇和確定因子及水平

如何正確的選擇因子及水平,完全依賴於工程師的經驗以及他對過程的理解。

在頭腦風暴/魚骨圖分析的基礎上,選擇所有主要的因子,而放棄哪些顯然不重要的因素。

因子水平取值應盡可能地分散,但不要過於分散,以便對分析造成不利影響。

水平取值的建議:以現行操作值為中心點,再來確定控制范圍內的最大值和最小值。

13、實驗設計的基本程序

14、實驗設計的種類

15、DOE基本統計知識補習

DOE提供瞭一套組織和表達數據的方法——結構化的矩陣表,按此方式提供數據:試驗條件X和實驗結果Y;同時為建立數學模型下達指令:要考察哪些因素,而哪些因素則不需要列入模型。

1)兩類錯誤與置信度

第Ⅰ類錯誤:記為α,也稱顯著性水平。拒絕一個正確的假設或結論的概率。

第Ⅱ類錯誤:記為β。接受一個錯誤的假設或結論的概率。

置信度:記為1-α。

α一般取值:0.01、0.05、0.10,系統默認值0.05。

——————————

2)正態分佈原理

正態分佈又稱高斯分佈,它是質量工程中運用最廣泛的連續分佈,是質量管理最核心的統計基礎。

正態分佈圖形/概率密度函數:

標準正態分佈圖

詳細的正態分佈介紹:https://zhuanlan.zhihu.com/p/128809461

小明每天上學的通勤時間是一個隨機變量X,這個變量服從正態分佈。統計他過去20天的通勤時間(單位:分鐘):26、33、65、28、34、55、25、44、50、36、26、37、43、62、35、38、45、32、28、34。現在我們想知道他上學花30~45分鐘的概率。

首先,我們將問題轉化為數學表達式,計算其上學花30~45分鐘的概率,就是求P(30 < X < 45)。一個變量服從正態分佈,立馬考慮到它的均數和標準差是多少。這裡我們簡化一下用他過去20天的樣本數據來代替。所以,我們首先計算這20天通勤時間的樣本均數及標準差。以下通過Excel計算:樣本均數=38.8(分鐘),標準差=11.4(分鐘)。

然後,我們進行標準化,這一步很重要,也稱Z變換。通過標準化,所有服從一般正態分佈的隨機變量都變成瞭服從均數為0,標準差為1的標準正態分佈。對於服從標準正態分佈的隨機變量,專門用Z表示。因此,求P(30 < X < 45),就轉換成瞭求P(-0.77 < Z < 0.54),標準化的具體計算如下。

  1. 30 → (30-38.8) / 11.4 = – 0.77
  2. 45 → (45-38.8) / 11.4 = 0.54
  3. X → Z
  4. P(30 ≤ X ≤ 45) = P(-0.77 ≤ Z ≤ 0.54)

經過標準化後,原來的曲線的形狀不會變化,也不會改變胖瘦,隻是位置發生平移。

——————————

3)正態分佈的三個關鍵性指標

一組數據用圖形來表示,就叫做分佈。用正態分佈來描述一個過程。

分佈的3個特征是幫助我們理解過程的關鍵!

——————————

4)修哈特3σ原則

雖然理論上正態隨機變量可以取無數個值,定義域是整個實數軸,但實際上在[-1,1]這個區間就包含瞭它可以取的68%的值,[-2,2]區間包含瞭95%的值,[-3,3]包含瞭它可能取的99.73%的值。

——————————

5)試驗誤差

包括系統誤差與隨機誤差

試驗總誤差=條件誤差+試驗誤差

條件誤差:指由於試驗條件(因子及水平)的變化引起的誤差。

試驗誤差:除試驗條件以外不可控的偶然因素引起的誤差。

——————————

6)方差分析的基本模式與目標

(1)方差分析(ANOVA)

它是假設檢驗的擴展,主要用於分析實驗結果,它將所有組間誤差與試驗誤差分離開來,然後分析檢驗其統計的顯著性:因子顯著性;擬合回歸的顯著性。

—————-

(2)方差分析的基本模式

顯著性檢定指標——P value

DOE分析的一個主要目的就是要區分哪些因子是關鍵的,哪些是次要的。這需要復雜的統計計算與檢測,但Minitab給我們一個簡便的方法——P值判定。

通過P value,我們還可以判斷:

該項是否屬關鍵因子(P<0.05=是)?

該模型是否屬呈現彎曲(P<0.05=是)?

該模型擬合是否有效(P<0.05=是)?

——————————

7)回歸分析的基本模式與目標

回歸分析:一種統計方法,它通過計算變量之間的相關系數進而估計X與Y之間的聯系公式。

直線回歸方程的一般形式是Y=a+bx

Y不但與多個自變量X1、X2……有關,還與AB、AA等類型有關,實際運用中令這些項為新的自變量,就可以化為多元線性回歸方程。

因子試驗設計應用的是一次線性回歸方程,其基本表達式為:

其中將二階項AA或交互項AB等,都看成是一個新的自變量X……

響應曲面設計應用的是二次曲面回歸方程,其基本表達式為:

第二單元 正交實驗設計與Minitab

1、DOE應用:正交實驗設計

它是日本戰後質量管理的重要工具,上世紀70年代傳入我國,在冶金、化工、電子、機械、紡織、醫藥等行業得到廣泛應用。

主要手段是運用正交表。

目的:進行工藝參數設計與優化及其質量改進

優點:運用范圍廣;因子及水平數不受約束;方法簡單易行,可手工操作,也可電腦操作。

2、正交表

1)什麼是正交表

它是一種規格化的表格,也是實驗計劃,從一般意義講,隻要掌握正交表的運用方法就可達到DOE目的。表達方式如下。

關於正交的詳細描述移步:信號與系統3-傅裡葉變換與頻域分析有關內容。

表2.2.1 L9(3^4)正交表

正交表案例:正交實驗設計過程。

——————————

2)正交表的性質

分佈均勻:任一列中,任一因素的水平(狀態)出現的次數相同。

整齊可比:任兩列中,任意一個水平組合出現的次數相同。

如果上述條件中的任一條不滿足,則不再是正交表。正交表的獲得有專門的算法,對應用者來說,不必深究。

3、實例應用(提高磁鼓電機輸出力矩)

磁鼓電機是彩色錄像機的關鍵部件之一,國外同類產品的力矩指標規定大於210g·cm。某廠工程師以這個水平做依據,對電機質量進行調查,不合格率為23%。決定利用試驗設計,提高電機的輸出力矩。

一切從簡單入手:正交設計是DOE體系中簡單實用的一種方法,通過本案例——瞭解DOE的基本概念、機理和操作步驟。

步驟1:明確品質改善和試驗目的,本試驗目的是提高磁鼓電機的輸出力矩,屬於單響應正交實驗設計。

步驟2:選擇響應變量(即品質特性)。

註意區分指標的三種情形——望小、望大、望目,這是正交實驗也是田口方法的特點。

本例用輸出力矩作為考察指標,是一個望大特性,要求越大越好。

步驟3:確定因子及水平

工程人員分析認為,影響輸出力矩要有3個因素:充磁量、定位角度及線圈匝數,根據以往經驗,分別確定瞭三個水平。此3個因素的排列組合為3*3*3=27種。通過Excel制作的因子水平表如下。

因子水平表

步驟4:制定實驗計劃(選擇正交表)

打開Minitab建立正交表。

進入正交表生成界面正交表設置通過Minitab生成的田口正交表

步驟5:進行試驗,測定試驗結果

(1)按照表2.2.2做試驗

表2.2.2 補齊實驗結果的正交表

通過直觀法可以確定實驗號5的效果最好,但看不出影響的程序,即哪個顯著、哪個次之,不能明確效應大小。將實驗結果填入Minitab的C4列,如下圖所示。

填入實驗結果的正交表

正交表移步:https://download.csdn.net/download/liht_1634/88056440

—————-

(2)試驗要點

①試驗的順序應當隨機化;

②每次試驗的環境條件基本相同;

③確定樣本大小:計量數據3個,離散數據50;

④不僅記錄響應數據,還應包括環境數據;

⑤確保計量系統可信(MSA);

⑥填列數據時要仔細,不要錯位。

步驟6:建立模型,分析數據

分析數據就要事先建立數學模型——這是DOE方法的基本策略;

本步驟要做兩件重要的工作:

A、通過計算整理,編制“均值分析表”;

B、手工繪制一份“主效應圖”。

均值分析:計算各因子每一個水平對Y的貢獻(均值)

通過Excel進行均值計算:

本結構化矩陣表下載移步:DOE實驗設計結構化矩陣表。27個排列組合中取出9個組合,其有一定的局限性。

R/效應的計算:因子的主效應=因子為高水平時輸出的平均值-因子為低水平時輸出的平均值。

通過Minitab產生均值響應表與主效應圖:

確定後即可生成均值響應表與主效應圖:

均值響應表與主效應圖主效應圖分析

效應:某因子由於其水平的變化而給Y帶來的影響,以其平均值的極差表示。

步驟7:分析數據,作出試驗結論

(1)選優準則

若是望大特性:則取最大響應所對應的水平;

若是望小特性:則取最小響應所對應的水平;

若是望目特性:則取適中響應所對應的水平。

(2)工程推斷

顯著因子排列:B – A – C,參照均值分析表

最優因子水平組合:A2 B2 C3,參照效應分析圖

最佳工藝設置:充磁量1100;定位角度11;線圈匝數90。

4、方差分析

充磁量、角度、匝數三個試驗因素對輸出力矩的影響在統計學上是不是顯著,那麼接下來需要進行方差分析。

1)調用方差分析

2)雙擊選擇響應與因子

3)方差分析結果

最簡單直接的解讀方法是直接看最後一列,概率p值。發現僅角度的p值小於0.05,也就是說統計上認為角度對試驗指標轉化率有顯著影響,統計上有意義。其他兩個因素影響相對較小。

現在角度在統計上認為是一個相對很重要的因素,它下設3個水平,請問這3個水平差異表現如何?該選誰作為優水平呢?所以,需要多重比較。

5、Minitab與DOE

1)Minitab簡述

Minitab是美國MINITAB公司發明的當今世界功能最為強大的統計軟件。

Minitab統計軟件為質量改善和概率應用提供準確和易用的工具。它被許多世界一流的公司所采用,包括通用電器、福特汽車、通用汽車、3M、LG、東芝以及Six Sigma顧問公司等。

作為統計學入門教育方面技術領先的軟件包,Minitab也被4000多所高等院校所采用。

——————————

2)Minitab讓統計變得如此簡單

實現六西格瑪改進的工具;打開統計奧秘之門的鑰匙;運用軟件讓我們成為專傢。

圖2.4.1 語言切換

——————————

3)Minitab的使用簡介

圖2.4.2 Minitab操作界面圖2.4.3 Minitab數據文件的特點與結構圖2.4.4 復原正交試驗計算結果圖2.4.5 使用Minitab進行預測

第三單元 全因子實驗設計

1、全因子設計基本原理

全因子設計:指所有因子及水平的所有組合都要至少要進行一次試驗。

將k個因子的二水平試驗記作2^k試驗。

當k=4時,試驗次數m=2^4=16次

當k=5時,試驗次數m=2^5=32次

當k=7時,試驗次數m=2^7=128次

……

2、全因子設計應用

1)應用

全因子設計是DOE方法體系中的典型代表。

運用瞭兩大統計功能——方差分析和回歸分析

方差分析——檢測並區分組間誤差與試驗誤差,借以確定因子的顯著性——自變量X對Y的影響。

回歸分析——建立回歸方程Y=f(x)進行方案選優。

——————————

2)作用

最重要的目的——用於全面分析系統(產品或過程)中所有因素的主效應和交互作用;也是選優的有效工具。

3、全因子設計約束條件

1)約束條件

因子總數≤5個;

因子水平數且隻能是2個,即(-)和(+);

中心點設置好:2~4個(不是必須的,試驗次數也將相應增加)。

4、關於試驗中的中心點

1)什麼是中心點?比如“反應溫度”

代碼 低-1 高+1 中心0
實際值 200℃ 300℃ 250℃

設置中心點的意義:

“重復試驗”的要求,增加中心點是一個較好的試驗安排。

增強瞭統計分析能力(評估實驗誤差及彎曲趨勢的能力)

——————————

2)什麼情況下使用中心點?因子設計、RSM

中心點設置次數:2~4個

根據實驗目的和實驗成本綜合考慮。

5、代碼值與真實值的換算

系統自動生成水平代碼值(-1、0、1)

好處:有連續變量和無量綱特點,有利於統計分析和建立回歸方程

低水平L 中心值 高水平H
真實值 100 150 200
代碼值 -1 0 +1

6、試驗實際分析五步流程

7、析因設計

1)二次建模

第一次建模:(擬定初選模型)

考察所有的因子,但不考慮三階(如ABC)及以上的項,此法則適用於所有模型。

第二次建模:(簡化模型)

利用初級模型分析的結果,刪除非顯著因子,隻使用顯著因子來構建較小的更好的模型;

是建立Y對X的回歸方程和優化器分析的基礎。

——————————

2)模型數據分析

Minitab回歸分析與方差分析,生成供我們分析的信息——工程師要學會解釋這些數據並作出正確的決策。

包括6項分析指標:

①總效果【H1:模型有效 P<0.05】

②彎曲【H0:無彎曲 P>0.05】

③失擬【H0:無失擬 P>0.05】

④擬合相關系數 R-Sq及R-Sq(adj)(預測的)越接近1越好;二者之差越小越好

⑤標準差S分析 越小越好

⑥因子效應顯著性

P值判定【H1:模型有效 P<0.05】

圖形判定(正態效應圖/帕累托效應圖)

8、實例應用(壓力成型塑膠板工藝條件)

目的是探討工藝條件對產品強度的影響,並試圖提高產品強度。計劃在試驗中安排4次中心點,因子水平表如下:

步驟1:確定設置試驗計劃

步驟2:安排試驗-實驗計劃與數據表

步驟3:一次建模——擬合模型

如何構築模型(第一次/全模型)

T設置:將需要考察的項目列入模型——包括所有的主效應和二階項,如A B C AB AC BC,但不考察三階及以上的項,如ABC。

一般情況下,均不考察三階及以上的項!本法則適合於任何設計模型。

殘差診斷

什麼是殘差?

殘差是響應觀察值與模型預測值之差別。

為什麼要進行殘差分析?

隻是進行ANOVA和回歸分析並不能保證模型符合實際情況,隻有殘差分析正常,才能判斷模型有效。

如何進行殘差分析?

殘差分析是通過4個圖形工具來進行的。

十、案例

1、爆米花制作過程

舉個生活中的例子,相信大傢都吃過爆米花,但是大傢是否都瞭解爆米花的制作過程?在品嘗爆米花的時候,不知道您是否註意到有很多爆米花沒有爆開,也有很多被爆焦。這兩種情況都是生產過程中的質量缺陷。

主要因子:

1 )加工爆玉米花的時間(介於 3 至 5 分鐘之間);

2 )微波爐使用的火力(介於 5 至 10 檔之間);

3 )使用的玉米品牌( A 或 B )。

響應:玉米的 " 爆開個數 " 或“爆開率”。

在爆玉米花時,我們希望所有(或幾乎所有)的玉米粒都爆開瞭,沒有(或很少)玉米粒未爆開,這是最終關註的重點。

試驗設計的主線是根據因子的取值范圍,進行多種參數組合,如下圖為兩水平試驗組合,形成多次試驗的方案,依次進行試驗後,通過試驗結果分析,確定哪一種參數組合是最優的。

利用最小二乘法等擬合方法,建立響應與多個因子之間的數學模型,亦稱響應面模型。

最終通過試驗設計確定:使用 A 品牌,加工 5 分鐘,並將火力調為 6.96 級。試驗預測在此種設置下加工,產出的玉米粒 445 個全部都爆開瞭。

本文的試驗既可以是實物試驗,也可以是仿真,在可靠性設計分析中,試驗設計常用於解決無法建立顯式的可靠性模型等問題,起到事半功倍的作用。