什麼是光學字元辨識(OCR)? 以及它的辨識原理

光學字元辨識 (Optical Character Recognition, OCR)是一種軟體,針對影印、繕打或手寫的文件,建立一個電腦可讀取的電子檔,而免去人工繕打或輸入文字。

OCR 通常用於PDF格式的掃描文件,但也可以使用圖片檔建立電腦可讀取的電子文字檔。

什麼是OCR?

OCR也稱為字元辨識,是一種軟體科技,可以將數字、文字和標點符號等字元,從影印或手寫文件轉換成電腦和其他軟體程式更容易閱讀和讀取的電子格式。

有些OCR程式是使用數位相機拍攝文件時進行辨識,而其它則是使用掃描機產生的圖片檔或現成照片,透過OCR技術來辨識內容。OCR能讓使用者在PDF文件中搜尋、編輯文件。

 

OCR可運用在哪裡?

對於日常少量的掃描需求,是否使用OCR來協助辦公或許不是大問題。但如果你要進行大量的文件掃描,並透夠把它轉換成文字檔,而不僅是圖片檔,能夠在PDF檔中搜尋到你需要的確切內容,那麼使用OCR就可以節省下相當多的時間。

下列是其他OCR可以協助的其他事項:

  • 自動處理和輸入資料(例如:工作應徵者的紙填履歷表變成電子檔建檔)。
  • 可在掃描的書籍中進行搜尋。
  • 將手寫掃描文件轉換成電腦可讀取的文字。
  • 讓協助視障人士的閱讀軟體更容易讀取文件。
  • 保存歷史文件、資料與新聞,且可在文件中進行搜尋。
  • 擷取資料並轉移至帳務軟體(例如收據和發票)。
  • 為文件編輯索引,以供搜尋引擎使用。
  • 使用高速相機和測速相機軟體進行車牌辨識。
  • 為無法說話的人進行語音合成,例如理論物理學家史蒂芬.霍金 (Stephen Hawking)是最知名的語音合成軟體使用者。

 

為什麼要使用OCR?

為什麼不直接拍照就好了? 因為拍照只是一張圖片,你無法做任何編輯或搜尋文字。掃描文件並使用OCR軟體進行辨識,可以將檔案轉換成你可以編輯和搜尋的電子文件。

 

OCR的發展歷史

雖然文字辨識技術的使用最早可追朔至1914年,但OCR相關科技的廣泛運用與發展是始於1950年代,特別是創造了非常簡化的字型,更容易轉換成可讀取的數位文字。

第一個簡化字型是由大衛.謝帕德 (David Shepard) 所創造,一般稱為OCR-7B。OCR-7B現今仍運用於金融產業,是信用卡和簽帳金融卡的標準字型。

1960年代,許多國家的郵政業務開始使用OCR科技,以大幅提升郵件分類的速度,包括美國、英國、加拿大和德國等。OCR現在仍是世界各地的郵政業務用於郵件分類的核心科技。

2000年,OCR科技突破了限制,並產生出一種關鍵技術,被用來開發防止機器人惡意攻擊伺服器與阻擋垃圾信件的人機驗證(CAPTCHA)程式。

幾十年來,由於相關科技領域的進步,如人工智慧、機器學習和電腦視覺,OCR已發展地更加準確且精密。現今,OCR軟體使用圖形識別、特徵檢測以及文件探勘,比以往執行更快速且能正確的轉換文件。