跳到主要內容
:::

教育百科logo

::: 光學字元辨認 - 教育百科
國家教育研究院辭書
基本資料
英文: Optical Character Recognition, OCR
作者: 吳正己
日期: 2000年12月
出處: 教育大辭書
辭書內容
名詞解釋:
  光學字元辨認,是一種讀入資料的系統。一般最普遍的資料輸入方法,是透過鍵盤將資料一一鍵入電腦中。可是,如果待輸入的資料已經是採用特定字體印刷而成,甚至是業經電腦列印完成者,便可以透過光學字元辨認系統來進行資料輸入,而省去鍵盤輸入的操作。這對龐大印刷資料的輸入有很大的助益。相對於光學字元辨認系統的是手寫字辨認系統。其差異是:前者所辨認的是具有特定字體的印刷資料,後者所辨認的是個人的手寫資料。
  一般來說,一套字元辨認系統通常包含三大部分,影像掃描器(Image scanner)、光學字元辨認軟體(或硬體)及輸出介面(Output interface)。其操作原理是:先透過影像掃描器將待輸入之文件掃描成一個影像,這個影像再送給字元辨認軟體(或硬體)進行字元辨認,由於有可供參考的字體,所以,整分影像文件會被轉換成一個個字元所組成的文件檔案。就像這些字元是由鍵盤輸入的一樣。最後,這個文件檔案再經由輸出介面,送到其他應用程式(如,文書處理軟體)進行資料輸入後之處理。
  OCR裝置基本操作步驟如下:
  1.將待讀文件置於OCR之輸入器中。
  2.將文件傳送入掃描裝置中。
  3.用光束掃描文件,產生的反射光線由感光裝置所接收。
  4.感光裝置將光學信號送至轉換器轉換成電腦內碼。
  5.電腦程式辨認轉換後的電腦內碼,並將無法辨認的內碼顯示在螢幕,由使用者重新輸入。
  一般而言,印刷字元辨認的正確率達99%以上,而手寫字體由於較為潦草,且書寫方式因人而異,其辨認技術仍有待進一步突破。
資料來源: 國家教育研究院_光學字元辨認
授權資訊: 資料採「 創用CC-姓名標示- 禁止改作 臺灣3.0版授權條款」釋出