:::
專有名詞標記 / 命名實體標註 - 教育百科
專 | |
有 | |
名 | |
詞 | |
標 | |
記 | |
/ | |
命 | |
名 | |
實 | |
體 | |
標 | |
註 |
國家教育研究院辭書
基本資料
英文: | named entity tagging |
作者: | 曾元顯 |
日期: | 2012年10月 |
出處: | 圖書館學與資訊科學大辭典 |
辭書內容
名詞解釋: 專有名詞標記(name entity tagging),或稱命名實體標註,是自然語言處理中的一項任務,也跟資訊檢索中的資訊擷取議題有關。在全文文件中,常有人名、地名、機構名等詞彙出現,以及關於時間、金錢等不同格式數據的表達,這些詞彙經常不會出現在既有的詞庫中,因此需要特別的標註,以便擷取及應用。以此句為例:「昨日報載誤指陳光標捐了伍佰元給西湖的人民黨」,專有名詞標記需將:「昨日」標註成時間名詞並轉換成日期,「陳光標」標註為人名,「伍佰元」標註為金錢數量,「西湖」標註為地名,「人民黨」標註為組織名。若標註技術不佳,可能會將該句斷出「日報」、「指陳」、「伍佰」等詞彙,以致於影響專有名詞的辨識與標記。專有名詞的標記,不僅可以解決詞庫涵蓋不足的問題,也因其牽涉到人、事、時、地、物等重要內容,對於文字的自動理解、推論、重點摘要,以及資訊的檢索、知識的探勘,都是重要的參考依據。國際上最早進行專有名詞標記的評比活動,是美國於1987年開始的訊息理解會議(Message Understanding Conference,簡稱MUC)。參與評比的隊伍,對英文的專有名詞標記,其最佳成效已接近人工標註的水準。對中文的標註,其成效雖然還有相當的落差,但已可協助大量語料的自動化處理,進行相關的應用。 |
|
資料來源: | 國家教育研究院_專有名詞標記 / 命名實體標註 |
授權資訊: | 資料採「 創用CC-姓名標示- 禁止改作 臺灣3.0版授權條款」釋出 |
貓頭鷹博士