跳到主要內容
:::

教育百科logo

::: 決定係數 - 教育百科
國家教育研究院辭書
基本資料
英文: Coefficient of Determination
作者: 余民寧
日期: 2000年12月
出處: 教育大辭書
辭書內容
名詞解釋:
  在雙變項資料分析中,當以χ變項預測Y變項時,假使不知道χ變項的大小,但又要針對Y變項進行預測,此時最簡便的一個做法便是以平均數 來作估計,亦即以平均數 來猜測其預測值Ŷ。此時,每一個觀察值將會有一個猜測的誤差(即y=Y- )存在,N個觀察值就有N個誤差存在。我們可以將每個誤差先予以各別平方之後,再加總起來,即得 ,稱作「總離均差平方和」(total sum of squares),有時又稱為「總變異量」(total variation),並以SSt表示(其中的t是total的縮寫)。
  如果已有某個預測方程式,我們將傾向使用預測方程式來估計,而不使用平均數來估計預測值Ŷ。此時,每個觀察值仍然會有個預測誤差(即Y-Ŷ)存在。若將每個誤差項各別予以平方後,再加總起來,即得Σ(Y-Ŷ)2,稱作「殘差值離均差平方和」(residual sum of squares),又稱作「未被解釋到的變異量」(unexplained variation),並以SSres表示(其中的res是residual的縮寫)。
  除了上述兩種預測方式外,預測Ŷ和預測 之間也會有一差距存在,此差值即為 。若將每個觀察值的此段差值先予以各別的平方,再加總起來,即得 ,稱作「迴歸離均差平方和」(regression sum of squares)又稱作「被解釋到變異量」(explained variation),並以SSreg表示(其中的reg是regression縮寫)。
  根據數學公式的推演,上述三種離均差平方和之間具有下列的數學函數關係:
  SSt=SSreg+SSres
  亦即表示
  (總離均差平方和)
  =(迴歸離均差平方和)
   +(殘差值離均差平方和)
  或
  (總變異量)=(被解釋到的變異量)
      +(未被解釋到的變異量)
  而所謂的「決定係數」,即是指上述公式中迴歸離均差平方和與總離均差平方和的比值,並以r2(如果是簡單迴歸分析)或R2(如果是多元迴歸分析)來表示;亦即
  
它的意思是:「在依變項Y的總變異量中,能被自變項X所解釋到的變異量百分比。」在簡單迴歸分析中,決定係數則是皮爾森積差相關係數的平方。
  在迴歸分析中,研究人員莫不期望決定係數值是愈大愈好,因為它表示依變項的總變異量可以被自變項解釋得到變異量部分愈大,因此,預測結果也愈正確。
資料來源: 國家教育研究院_決定係數
授權資訊: 資料採「 創用CC-姓名標示- 禁止改作 臺灣3.0版授權條款」釋出