一、迴 歸 分 析
 
 
 

1.  線性迴歸模式: 是不是數據點的散布圖看起來像直線的(如下面的 (1) 圖), 才適合用線性迴歸分析或迴歸分析的方法呢 ? 不是的, 只要數據點的散布圖看起來像某一種函數的圖形, 都可以用迴歸分析的方法, 其中如果迴歸模式的待求、未知參數(係數)呈線性的話(例如以下的 (2) (6) 圖), 就是所謂的線性迴歸分析模式; 如果迴歸模式的待求、未知參數(係數)呈非線性的話, 就是所謂的非線性迴歸分析模式

  舉例來說: (a) Y = a + b X,  (b) Y = a + b X + c X2,

       (c) Y = a + b XC,

(a) 中的待求係數是 a 和 b, (a) 是線性迴歸分析模式;

(b) 中的待求係數是 a、b 和 c, (b) 是線性迴歸分析模式;

(c) 中的待求係數是 a、b 和 C, (c) 是非線性迴歸分析模式。

但是, 如果 (c) 中的 C 已經知道是多少, 待求係數只剩 a 和 b 的話, 那麼這時的 (c) 就是線性迴歸分析模式了。
 
 

  雖然線性迴歸分析模式使用上有其限制, 但如能善加運用它的方法, 仍然可以對數據分析方面提供有用的資訊、並有所貢獻的。
 

  線性迴歸分析是本電子書所介紹的範圍, 以下首先看看幾種可以用線性迴歸分析方法來分析的數據點散布圖(自變數記成 X 為橫軸, 因變數記成 Y 為縱軸)型式。
 
 
 
 
 
 
 

(1). 散布圖呈直線型式 :


  

  上圖的紅色數據點都在一條直線附近出現, 並非所有數據點皆恰落在此直線上, 而是每個數據點和此直線的接近程度可能不一樣。上圖的這些紅色數據點如果要用此直線來表示的話, 因為有些數據點沒有剛好落在直線上, 所以產生了誤差。有誤差存在是正常的現象, 只要誤差總體來說是在容許範圍之內。
 
 
 
 
 
 
 
 
 
 

(2). 散布圖呈二次曲線型式 :

  

  上圖的紅色數據點都在一條二次曲線附近出現, 並非所有數據點皆恰落在此二次曲線上, 而是每個數據點和此二次曲線的接近程度可能不一樣。上圖的這些紅色數據點如果要用此二次曲線來表示的話, 因為有些數據點沒有剛好落在二次曲線上, 所以產生了誤差。有誤差存在是正常的現象, 只要誤差總體來說是在容許範圍之內。
 
 
 
 
 
 
 
 

(3). 散布圖呈三次曲線型式 :

  

  上圖的紅色數據點都在一條三次曲線附近出現, 並非所有數據點皆恰落在此三次曲線上, 而是每個數據點和此三次曲線的接近程度可能不一樣。上圖的這些紅色數據點如果要用此三次曲線來表示的話, 因為有些數據點沒有剛好落在三次曲線上, 所以產生了誤差。有誤差存在是正常的現象, 只要誤差總體來說是在容許範圍之內。
 
 
 
 
 
 
 
 

(4). 散布圖呈指數曲線型式 :


  

  上圖的紅色數據點都在一條指數曲線附近出現, 並非所有數據點皆恰落在此指數曲線上, 而是每個數據點和此指數曲線的接近程度可能不一樣。上圖的這些紅色數據點如果要用此指數曲線來表示的話, 因為有些數據點沒有剛好落在指數曲線上, 所以產生了誤差。有誤差存在是正常的現象, 只要誤差總體來說是在容許範圍之內。
 
 
 
 
 
 
 
 
 

(5). 散布圖呈對數曲線型式 :

  

  上圖的紅色數據點都在一條對數曲線附近出現, 並非所有數據點皆恰落在此對數曲線上, 而是每個數據點和此對數曲線的接近程度可能不一樣。上圖的這些紅色數據點如果要用此對數曲線來表示的話, 因為有些數據點沒有剛好落在對數曲線上, 所以產生了誤差。有誤差存在是正常的現象, 只要誤差總體來說是在容許範圍之內。
 
 
 
 
 
 
 
 
 

(6). 散布圖呈開根號曲線型式 :

  

  上圖的紅色數據點都在一條開根號曲線附近出現, 並非所有數據點皆恰落在此開根號曲線上, 而是每個數據點和此開根號曲線的接近程度可能不一樣。上圖的這些紅色數據點如果要用此開根號曲線來表示的話, 因為有些數據點沒有剛好落在開根號曲線上, 所以產生了誤差。有誤差存在是正常的現象, 只要誤差總體來說是在容許範圍之內。

 
 

 
 
Copyright 1999 易得太資訊(統計桃花源)