利用NVDA搭配Win 10 OCR

分類:NVDA小技巧   2018/04/02

文/ 陳鵬安


熟悉螢幕報讀軟體的使用者一定知道,螢幕報讀軟體只能將電腦上的文字朗讀出來,針對以圖片格式呈現的文字來說,就沒有辦法了,例如使用掃描的pdf文件、網頁上以圖型表示的按鈕或連結、沒有清楚標示出每個選項的應用程式等等。遇到這些看似沒轍的狀況時,往往必須透過明眼人的報讀協助,或是透過光學文字辨識(OCR)的技術來獲取圖中的文字。

OCR 全名為光學字元辨識 (Optical Character Recognition),它是透過影像處理的技術來將圖片中的文字辨識出來。在過去,我們必須將要辨識的畫面截圖下來,透過其它的軟體或網站來協助我們進行辨識,但在Windows 10以後,微軟便有內鍵OCR的功能,而NVDA也可搭配將其讀出。


要使用文字辨識的功能,首先必須確認你所使用的系統為Windows 10,並且NVDA為2017.3以後的版本。

進行文字辨識的快速鍵是NVDA+r,取「辨識」的英文 Recognition 之首字母。若你的電腦已安裝NVDA 2017.3以後的版本,但並不是Windows 10系統,按下此快速鍵時會聽到NVDA提示「無法使用Windows 10光學字元辨識」。


OCR的辨識範圍是指整個導航器物件,也就是檢閱游標所在的物件區域來做辨識,而在預設狀況下,檢閱游標是跟隨系統焦點或插入點編輯游標移動。前述的導航器物件可透過按NVDA+數字鍵盤5而得知。以下試舉例說明。

當你在網頁中遇到一個含有文字的圖型、連結或是按鈕需要辨識時,可以直接將焦點移到該位置上,接著按下NVDA +r。

辨識的結果會以類似文件的方式呈現,你可以使用上下方向鍵來瀏覽它,若所辨識的是一個連結或按鈕,你也可以直接在它上面按Enter或空白鍵來啟動。若讀過辨識的文字,不想與之進行進一步的互動,可以按Esc來返回剛才的頁面。需要注意的是,由於辨識的範圍是根據檢閱游標所在的物件,因此並非當前的整個畫面。

另外一個常需要辨識的狀況是,當你拿到一份使用掃描的pdf或jpg圖檔,因為此時的導航器是指向整份文件,你只要在開啟檔案後,直接按NVDA +r來辨識其上的內容即可。


Windows 10可辨識的語言有那些呢?這要取決於Windows 10作業系統所能提供的語言而定,不過NVDA允許我們變更設定,調整使用不同的OCR辨識語言,其操作方式是從NVDA功能表 → 偏好設定 → Windows 10 光學字元辨識中進行調整。可以選擇的語言是根據你在系統中所啟用的語言,想要新增語言,可以按Windows +i 開啟設定視窗,接著選擇「時間與語言」,然後選擇「地區與語言」中的「新增語言」。


有時若你覺得辨識的結果錯誤很多,而不如預期,或是在辨識時聽到NVDA提示「內容是隱藏的」,需特別注意以下幾點,或許可以改善辨識的效果:

  1. 視窗的位置是否在畫面中,或是被其它視窗覆蓋:有時候雖然用NVDA操作視窗都很正常,但該應用程式不一定完全顯示在畫面中,此時我們可以嘗試按 Windows+向上鍵來將視窗調整到最大化,再進行辨識。
  2. 網頁呈現的大小也會影響辨識的準確率:在瀏覽器中,我們可以使用Ctrl++(加號)、Ctrl+-(減號),來將畫面放大或縮小;利用 Ctrl +主鍵盤 0 來將畫面還原至預設大小。嘗試將畫面放大再進行辨識可能提高辨識的準確度。

不僅是在網頁和圖檔中可以使用辨識功能,幾乎每個地方只要你覺得該處有文字呈現,但NVDA無法正確報讀時,都可以試著按下NVDA+r來辨識其上的內容看看。有了這麼簡單方便又強大的功能,相信大家以後在使用NVDA時,會更加有效率。