利用NVDA搭配Win 10 OCR@NVDA 部落

文/ 陳鵬安

熟悉螢幕報讀軟體的使用者一定知道，螢幕報讀軟體只能將電腦上的文字朗讀出來，針對以圖片格式呈現的文字來說，就沒有辦法了，例如使用掃描的pdf文件、網頁上以圖型表示的按鈕或連結、沒有清楚標示出每個選項的應用程式等等。遇到這些看似沒轍的狀況時，往往必須透過明眼人的報讀協助，或是透過光學文字辨識(OCR)的技術來獲取圖中的文字。

OCR 全名為光學字元辨識 (Optical Character Recognition)，它是透過影像處理的技術來將圖片中的文字辨識出來。在過去，我們必須將要辨識的畫面截圖下來，透過其它的軟體或網站來協助我們進行辨識，但在Windows 10以後，微軟便有內鍵OCR的功能，而NVDA也可搭配將其讀出。

要使用文字辨識的功能，首先必須確認你所使用的系統為Windows 10，並且NVDA為2017.3以後的版本。

進行文字辨識的快速鍵是NVDA+r，取「辨識」的英文 Recognition 之首字母。若你的電腦已安裝NVDA 2017.3以後的版本，但並不是Windows 10系統，按下此快速鍵時會聽到NVDA提示「無法使用Windows 10光學字元辨識」。

OCR的辨識範圍是指整個導航器物件，也就是檢閱游標所在的物件區域來做辨識，而在預設狀況下，檢閱游標是跟隨系統焦點或插入點編輯游標移動。前述的導航器物件可透過按NVDA+數字鍵盤5而得知。以下試舉例說明。

當你在網頁中遇到一個含有文字的圖型、連結或是按鈕需要辨識時，可以直接將焦點移到該位置上，接著按下NVDA +r。

辨識的結果會以類似文件的方式呈現，你可以使用上下方向鍵來瀏覽它，若所辨識的是一個連結或按鈕，你也可以直接在它上面按Enter或空白鍵來啟動。若讀過辨識的文字，不想與之進行進一步的互動，可以按Esc來返回剛才的頁面。需要注意的是，由於辨識的範圍是根據檢閱游標所在的物件，因此並非當前的整個畫面。

另外一個常需要辨識的狀況是，當你拿到一份使用掃描的pdf或jpg圖檔，因為此時的導航器是指向整份文件，你只要在開啟檔案後，直接按NVDA +r來辨識其上的內容即可。

Windows 10可辨識的語言有那些呢？這要取決於Windows 10作業系統所能提供的語言而定，不過NVDA允許我們變更設定，調整使用不同的OCR辨識語言，其操作方式是從NVDA功能表 → 偏好設定 → Windows 10 光學字元辨識中進行調整。可以選擇的語言是根據你在系統中所啟用的語言，想要新增語言，可以按Windows +i 開啟設定視窗，接著選擇「時間與語言」，然後選擇「地區與語言」中的「新增語言」。

有時若你覺得辨識的結果錯誤很多，而不如預期，或是在辨識時聽到NVDA提示「內容是隱藏的」，需特別注意以下幾點，或許可以改善辨識的效果：

視窗的位置是否在畫面中，或是被其它視窗覆蓋：有時候雖然用NVDA操作視窗都很正常，但該應用程式不一定完全顯示在畫面中，此時我們可以嘗試按 Windows+向上鍵來將視窗調整到最大化，再進行辨識。
網頁呈現的大小也會影響辨識的準確率：在瀏覽器中，我們可以使用Ctrl++（加號）、Ctrl+-（減號），來將畫面放大或縮小；利用 Ctrl +主鍵盤 0 來將畫面還原至預設大小。嘗試將畫面放大再進行辨識可能提高辨識的準確度。

不僅是在網頁和圖檔中可以使用辨識功能，幾乎每個地方只要你覺得該處有文字呈現，但NVDA無法正確報讀時，都可以試著按下NVDA+r來辨識其上的內容看看。有了這麼簡單方便又強大的功能，相信大家以後在使用NVDA時，會更加有效率。