跳到主要內容
:::

教育百科logo

::: F度量 - 教育百科
F
國家教育研究院辭書
基本資料
英文: F-measure
作者: 曾元顯
日期: 2012年10月
出處: 圖書館學與資訊科學大辭典
辭書內容
名詞解釋:

  F度量(F-measure)是一種同時兼顧查準率(precision)與查全率(recall)的度量方式,應用於資訊檢索(information retrieval)領域的成效評估,以方便不同技術或系統之間的成效比較。

  評估資訊檢索系統的成效時,常將系統的判斷與人工的判斷做交叉分析。例如,針對某項檢索條件的相關文件(亦即答案文件,人工檢視所有文件後判斷為相關的文件),以及系統的檢出資料(亦即系統判斷的相關文件),分析其篇數分布,可列表如下:

文件篇數
判斷分析表

系統判斷
相關
不相關

人工
判斷

相關
正確正例(true positive,簡稱TP)篇數
錯誤負例(false negative,簡稱FN)篇數
不相關
錯誤正例(false positive,簡稱FP)篇數
正確負例(true negative,簡稱TN)篇數

  則查準率的計算公式如下:P = TP / ( TP + FP );而查全率的計算公式如下:R = TP / ( TP + FN );而F度量的計算公式則為P與R的調和平均(harmonic mean):F = 2 / ( 1 / P + 1 / R) = 2 * P * R / ( P + R ) = 2 * TP / ( 2*TP + FP + FN )。

  F度量的一般化公式(general formula)為:Fb = (1+b*b) * P * R / ( b*b*P + R ),其中b為參數,控制查準率與查全率的權重。因此,F2表示較強調查全率,F0.5較強調查準率。
F度量又稱F分數(F-Score)或是F1分數(F1-Score),其源自於van Rijsbergen的E度量:Ea = 1–1 / ( a / P + (1–a) / R),其中參數a與上述b的關係為a=1/(1+b*b)。當a=1/2時,E = 1–2 / ( 1 / P + 1 / R) = 1 - F。

  在資訊檢索領域的文件自動分類研究裡,分類器的成效,也大多以F度量來評估,但常因文件有多重分類(一篇文件可以同時分屬多種類別)以及類別的文件篇數分不均的情形,F度量又細分為Micro-F與Macro-F兩種,其計算公式如下:



  其中C是類別總數,i代表某一類別。由於Micro-F是全部文件一起累加統計,不分類別,因此容易受到少量的大類別(佔大多數文件)表現好壞的影響。相對的,Macro-F考慮每個類別的成效後再做平均,因此容易受到大量的小類別影響。將兩種平均數據都報告出來,可以瞭解大多數文件的分類效果(Micro-F),以及大多數類別的分類效果(Macro-F)。

  F度量只能評估相關、不相關這種二分法判斷的結果。對於文件的相關判斷有超過兩種程度的區別時,例如,相關、部分相關、不相關等三種區別,則有最近幾年才被提出的貼現累計收益(discounted cumulative gain,簡稱DCG)可以運用。

參考資料:
Van Rijsbergen, C. J. (1979). Information Retrieval (2nd ed.). London: Butterworths.
資料來源: 國家教育研究院_F度量
授權資訊: 資料採「 創用CC-姓名標示- 禁止改作 臺灣3.0版授權條款」釋出
回到頁面頂端圖示