跳到主要內容
:::

教育百科logo

::: 複核驗證法;效度複核 - 教育百科
國家教育研究院辭書
基本資料
英文: Cross-Validation
作者: 余民寧
日期: 2000年12月
出處: 教育大辭書
辭書內容
名詞解釋:
  在多元迴歸分析中,研究者常會使用多種指標來協助選擇一個最佳的迴歸模式,這些指標的使用標準包括:
  1.R2值(即決定係數值)最大;
  2.S2值(即殘差值的變異數)最小;
  3.預測值的預測區間最窄;
  4.Cp最小;
  5.PRESS值最小。
  當研究者參考這些指標選出一個最佳的迴歸模式後,並無法驗證該模式即為具最佳預測效力的模式。為了確認該模式的效度(validaty)問題,以便未來據以進行預測及降低預測的誤差,研究者通常有兩種方法可行:
  1.重新收集另一筆資料,並以該模式來預測新樣本的依變項值,並求出預測誤差(即新樣本依變項上之觀察值與依該模式預測出的預測值之間的差值)的變異數及考驗其顯著性,以確認該模式的預測效度。但由於收集一筆新樣本資料,往往不是那麼容易或負擔得起,因此,這種作法較不實際,殊少被研究者使用。
  2.使用折半樣本(hold-out sample)(即以隨機方式將原來的分析樣本分成兩半),以其中一半的樣本來建立最佳模式,並拿該模式來預測另一半樣本,看看預測誤差的變異數是否達顯著水準,以判定該模式的預測效度。
  像上述第二種作法,以一半樣本來建立模式,並以另一半樣本來驗證該模式的效度,即稱作「複核驗證法」。
  測驗編製者為分析測驗與效標的真正關係,排除機率因素,通常會運用「效度複核」重新驗證測驗的鑑別力。
  另致度複核係指測驗編製者選取新受試者,重新驗證所編測驗題目的鑑別力,並分析其與原先受試者所得結果的差異程度。若差異甚微,表示測驗可用於新受試者或受試者所屬的母群體,更可說明測驗題目與效標的關係是真實的,而非機率造成的。若差異甚大,顯示測驗題目與效標的關係可能是非機率造成的,測驗編製者必須重新編擬一些與效標相關的題目,或重新編擬新的測驗。由此可見,以其他群體來進行效度複核,主要作用在於驗證;若兩者結果差異甚大,測驗編製者必須重編測驗題目。
  進行效度複核的重點在選取新受試者重新驗證,若選取受試者不適合,則必然產生甚大誤差。選取新的受試者必須依據效度複核的目的,選取具代表性的夠大樣本,方可減少誤差。
資料來源: 國家教育研究院_複核驗證法;效度複核
授權資訊: 資料採「 創用CC-姓名標示- 禁止改作 臺灣3.0版授權條款」釋出
回到頁面頂端圖示