:::
關聯檢索系統 - 教育百科
關 | |
聯 | |
檢 | |
索 | |
系 | |
統 |
國家教育研究院辭書
基本資料
英文: | Association Retrieval System |
作者: | 莊道明 |
日期: | 1995年12月 |
出處: | 圖書館學與資訊科學大辭典 |
辭書內容
名詞解釋: 關聯檢索系統是將系統內的字彙,依照字彙與字彙同時出現的頻率,建立一套系統的字彙網路圖,使得系統內的字彙依照分類的架構自動串接起來。在實際檢索時,讀者雖然只輸入少數幾個檢索語,但經過這個架構的輔助,將使檢索語與所有相關的字彙自動結合在一起,增進檢索的效果。此種具備字彙網路圖的檢索系統,稱之為關聯檢索系統。 關聯檢索的概念最早是由史泰爾斯(H.E. Stiles)於1961年提出。他於檢索系統中,定義出一個關聯因素值(Association Factor),以測定兩字彙同時出現的實際值與觀察值之差值。從此之後,史賓格爾(J. Spiegel),古利耶洛(V.E. Giuliano)及鍾斯(P.E. Jones)等從事更深入的研究。 關聯檢索系統內的辭彙架構,可以是文章內的字彙,或是由專家所給予的描述語。系統內的字彙依據字彙同時出現的機率,自動計算相關係數,並建立起一個字彙矩陣表。從表中可以顯示出,字彙間同時出現於一篇文章段落的頻率。凡是數值越高,則表示二字彙的關聯性越強,反之則越弱。換言之,在這個字彙的矩陣表之中,字彙之間關聯性的強弱,乃由不同字彙同時出現的傾向程度決定。在系統中,決定字彙關聯程度的指標又稱為關聯因素值(Association Factor),在語意上又可以字彙間距(Between-Word Distances)稱之。 關聯檢索方式可視為一種索引字彙的網路。當此一網狀字彙,以機讀格式儲存於電腦後,系統網路可以由最初輸入的檢索辭彙,自動串連其他相連的字彙,檢索出相關的文獻。在實際檢索時,檢索者輸入數個檢索字彙,系統自動將輸入之字彙,經由網狀的字彙圖中連接出第一代關聯字彙,並依第一代關聯字彙串接出第二代關聯字彙。因此,雖然檢索者只輸入少數幾個檢索字彙,但系統自動將關聯的字彙聯接一起,使檢索出文獻更完整。例如在一般的檢索策略中,若下「A and B and C」的指令,(其中A, B, C代表輸入的檢索字彙),則在非關聯的檢索系統中,必須同時具有A, B, C3個字彙的文獻,才可被檢索出來。因此,往往檢索出來的文獻篇數偏低。相對在關聯檢索系統中,當輸入相同的檢索策略時,系統自動透過字彙網路圖,以 A, B, C為中心,連接出第一代關聯字彙A1, B1, C1,然後再串出第二代關聯字彙,A2, B2, C2。最後的檢索策略成為:((A or A1 or A2)and(B or B1 or B2)and(C or C1 or C2))依據上述的檢索策略,檢索程式自動計算每個字彙間的關聯因素值,作為檢索的依據。使檢索的範圍擴大,增加檢索的文獻篇數。 關聯檢索方式比傳統的檢索方法,除了擴充檢索範圍的層面外,因第一、二代的字彙是依據字彙的關聯性所選出,因此也擴大了檢索語義的範圍。這將有助於提高檢索的回現率(Recall Ratio)。 |
|
資料來源: | 國家教育研究院_關聯檢索系統 |
授權資訊: | 資料採「 創用CC-姓名標示- 禁止改作 臺灣3.0版授權條款」釋出 |
貓頭鷹博士