多項式迴歸




1.源由     2.方法     3.特性及應用     4.範例     5.操作

  1. 源由

  2. 當遇到一組相關的雙變數資料  時,通常會想由其中一個變數值  來預測另一個變數值 。建立兩變數之間的迴歸方程式,是決解此類問題最簡單也是最好的方法,在此我們以多項式迴歸 (Montgomery and Peck, 1991, p.202) 為例,即以  來預測 

    希望透過此 Applet 來對所輸入的雙變數資料點,計算並畫出兩變數之間的多項式迴歸方程式。
     
     

  3. 方法

  4. 多項式迴歸方程式  是平面上許多數據點的一條最佳配適曲線,使用的方法稱為最小平方法。此方法是要使所有數據點到迴歸方程式的殘差平方和為最小,或者是說數據點到迴歸線的垂直距離平方和達到最小,即求解 
     
     
  5. 特性及應用

  6. Applet 是藉由多項式迴歸方程式來建立兩個相關變數之間的曲線方程式,用來對變數作預測及離群子的分析。

    藉由原始資料點所畫出之『原多項式迴歸線』,與經過刪除、增加或移動資料點等動作之後所得之『新多項式迴歸線』兩者之間的互動情況,讓使用者更進一步瞭解刪除、增加或移動資料點對迴歸線的影響,尤其若所增加或刪除的點為離群值的時候。

    此Applet 可以檢測是否有離群子或離群組發生,當有這些點出現時,將會發現迴歸方程式會預測得較不準確。利用此 Applet 不但可以使學習者明確的知道多項式迴歸方程的含意,更可讓他們清楚的明瞭離群子的意義及其影響力。
     
     

  7. 範例

  8. Montgomery and Peck (1991) 書中例子2.1的資料為例,如圖十三,由這些資料點所得到的圖及迴歸線可以發現隨著Age of propellant 的增加,Shear strength 逐漸減少。而由這個 Java Applet 所畫出來的圖形及所得到的迴歸線更可以證實這一點。

    現在,在圖十三上面的資料點中再加入兩個點,如圖十四,其中左下角的點會把回歸線的左邊往下拉,而右上角的點會把迴歸線的右邊往上拉,由下圖可以看出離群子對迴歸線的影響非常的大,隨著離群子的偏離所得到的迴歸線會更不準確。

    圖十五為四次多項式迴歸及加點所得到的結果,由所得到的  可發現,隨著多項式次方越大配適的越好。

    (圖十三) 一次多項式迴歸

    (圖十四) 一次多項式迴歸

    (圖十五) 四次多項式迴歸


  9. 操作

  10. 這個 Applet 可做一至五次的多項式迴歸,預設次數為一次。並且在資料輸入區已有一組預設資料點,只要按確定鈕,就可以在右邊圖區得到此組資料點的一次多項式迴歸方程式 (即簡單線性迴歸方程式) 及其圖形,如上面的例子。如欲選擇其它次數多項式只要在選取捲軸再選取即可。

    若欲修改資料點,必需先把資料點成雙成對的輸進資料區,也就是x軸每加一點,相對應的y軸也必需加一點,按確定鈕之後,就可以在右邊的版面上看到所得到的簡單線性迴歸方程式及其圖形。

    如果想刪除、增加或移動資料點,有兩種方法可使用:一種是在左邊的資料輸入區加以修改,另一種則是直接利用滑鼠在右邊的圖區加以修改。利用滑鼠來做修改,刪除資料點的方法為:先用滑鼠按住資料點使其消失,然後把資料點拖曳到圖區外面並放開滑鼠按鍵。增加資料點的方法為:先在圖區外面按著滑鼠,然後把資料點拖曳到要放置的圖區位置,並放掉滑鼠按鍵。移動資料點的方法:先用滑鼠按住資料點使資料點消失,然後拖曳到圖區欲放置資料點的位置,然後放開滑鼠按鍵。