| 一、迴 歸 分 析 |
1. 線性迴歸模式: 是不是數據點的散布圖看起來像直線的(如下面的 (1) 圖), 才適合用線性迴歸分析或迴歸分析的方法呢 ? 不是的, 只要數據點的散布圖看起來像某一種函數的圖形, 都可以用迴歸分析的方法, 其中如果迴歸模式的待求、未知參數(係數)呈線性的話(例如以下的 (2) 到 (6) 圖), 就是所謂的線性迴歸分析模式; 如果迴歸模式的待求、未知參數(係數)呈非線性的話, 就是所謂的非線性迴歸分析模式。
舉例來說: (a) Y = a + b X, (b) Y = a + b X + c X2,
(c) Y = a + b XC,
(a) 中的待求係數是 a 和 b, (a) 是線性迴歸分析模式;
(b) 中的待求係數是 a、b 和 c, (b) 是線性迴歸分析模式;
(c) 中的待求係數是 a、b 和 C, (c) 是非線性迴歸分析模式。
但是, 如果 (c) 中的 C 已經知道是多少, 待求係數只剩
a 和 b 的話, 那麼這時的 (c) 就是線性迴歸分析模式了。
雖然線性迴歸分析模式使用上有其限制, 但如能善加運用它的方法,
仍然可以對數據分析方面提供有用的資訊、並有所貢獻的。
線性迴歸分析是本電子書所介紹的範圍, 以下首先看看幾種可以用線性迴歸分析方法來分析的數據點散布圖(自變數記成
X 為橫軸, 因變數記成 Y 為縱軸)型式。
(1). 散布圖呈直線型式 :
上圖的紅色數據點都在一條直線附近出現,
並非所有數據點皆恰落在此直線上, 而是每個數據點和此直線的接近程度可能不一樣。上圖的這些紅色數據點如果要用此直線來表示的話,
因為有些數據點沒有剛好落在直線上, 所以產生了誤差。有誤差存在是正常的現象,
只要誤差總體來說是在容許範圍之內。
上圖的紅色數據點都在一條二次曲線附近出現,
並非所有數據點皆恰落在此二次曲線上, 而是每個數據點和此二次曲線的接近程度可能不一樣。上圖的這些紅色數據點如果要用此二次曲線來表示的話,
因為有些數據點沒有剛好落在二次曲線上, 所以產生了誤差。有誤差存在是正常的現象,
只要誤差總體來說是在容許範圍之內。
上圖的紅色數據點都在一條三次曲線附近出現,
並非所有數據點皆恰落在此三次曲線上, 而是每個數據點和此三次曲線的接近程度可能不一樣。上圖的這些紅色數據點如果要用此三次曲線來表示的話,
因為有些數據點沒有剛好落在三次曲線上, 所以產生了誤差。有誤差存在是正常的現象,
只要誤差總體來說是在容許範圍之內。
(4). 散布圖呈指數曲線型式 :
上圖的紅色數據點都在一條指數曲線附近出現,
並非所有數據點皆恰落在此指數曲線上, 而是每個數據點和此指數曲線的接近程度可能不一樣。上圖的這些紅色數據點如果要用此指數曲線來表示的話,
因為有些數據點沒有剛好落在指數曲線上, 所以產生了誤差。有誤差存在是正常的現象,
只要誤差總體來說是在容許範圍之內。
上圖的紅色數據點都在一條對數曲線附近出現,
並非所有數據點皆恰落在此對數曲線上, 而是每個數據點和此對數曲線的接近程度可能不一樣。上圖的這些紅色數據點如果要用此對數曲線來表示的話,
因為有些數據點沒有剛好落在對數曲線上, 所以產生了誤差。有誤差存在是正常的現象,
只要誤差總體來說是在容許範圍之內。
上圖的紅色數據點都在一條開根號曲線附近出現, 並非所有數據點皆恰落在此開根號曲線上, 而是每個數據點和此開根號曲線的接近程度可能不一樣。上圖的這些紅色數據點如果要用此開根號曲線來表示的話, 因為有些數據點沒有剛好落在開根號曲線上, 所以產生了誤差。有誤差存在是正常的現象, 只要誤差總體來說是在容許範圍之內。