圖片和PDF文件的文字辨識

分類:學習交流   2015/01/30

文/吳志超

我們透過NVDA協助得以瀏覽網頁、閱讀文件,但你是否遇到過一個難題,有些資料可能是以圖片方式呈現的,這樣一來NBDA就沒辦法讀取圖片內容了,或許你知道可以透過所謂的OCR(光學文字辨識)軟體便能將圖片上的文字轉換為可被編輯的文字,如此即可以NVDA閱讀內容。
不過這類軟體都為商業軟體,且視障者能否順利操作也是個問題,對於圖片資料的閱讀通常若不是找明眼人告知內容或是幫忙辨識轉換格式,大概只有放棄一途。
但事情好像也沒那麼糟,因為我想到了Google大神……


一提到Google,你只想到搜尋引擎、Gmail或Youtube嗎?Google提供的服務可不是只有這樣而已,它的雲端硬碟服務也是很多人在用的喔!
很奇特的是這個雲端硬碟服務提供了將圖片或PDF檔案辨識轉換的功能,正好可滿足我們的需求,做法是將檔案上傳至雲端硬碟進行辨識。
當然了,要使用Google雲端硬碟,你必須先要有Gmail信箱才行,沒有的話就趕快免費申請一個吧!
另外要使用Google雲端硬碟,建議使用Firefox瀏覽器以便能和NVDA做最佳搭配。


首先到Google首頁(網址:www.google.com),按K鍵到[更多]連結Enter,再按K鍵一次就可找到[雲端硬碟]連結,Enter進入登入頁面,輸入電子郵件和密碼後登入。
登入後的操作介面有分舊版與新版兩種,以下將分別說明,至於要如何知道自己所進入的是何種介面,請在登入雲端硬碟後確認NVDA處於焦點模式得情況下,按T鍵跳到[設定]功能表,按向下鍵移動若有[離開新版雲端硬碟]這個項目表示目前是新版操作介面,若有[體驗新版雲端硬碟]這個項目則目前是舊版操作介面。


舊版雲端硬碟:
1.進入雲端硬碟後,請按NVDA+空格鍵切換為焦點模式,此為重要的一步,在雲端硬碟中須切換為焦點模式才能順利使用。


註:在Google雲端硬碟中檔案與資料夾的檢視方式分清單與格狀兩種,建議設為清單檢視以利後續操作,在瀏覽模式下按B鍵找到[切換為清單]切換按鈕,若沒提示[按下]則按Enter切換,切換後會直接跳到檔案與資料夾清單的位置且NVDA會轉為焦點模式,若切換後沒有上述的情況,請按NVDA+空格鍵切換為焦點模式。


2按T鍵跳到[設定]功能表,按向下鍵到[上傳設定],展開子功能表往下到[每次上傳前都要確認設定],請確認這項是否有勾選,如沒有的話按Enter勾選,這個部份只要做一次即可,往後可不必再確認。
3.先按G鍵後再按L鍵可跳到檔案和資料夾清單的位置並會提示[檔案與資料夾清單],如果你未曾使用過雲端硬碟,這裡應該是空的沒有東西,若有的話則按上下鍵移動可瀏覽雲端硬碟裡的檔案或資料夾。


註:這裡的G和l並不是如同一般我們在按各種快速鍵的按法,而是依序按G鍵後放開再按L鍵放開。


4.按C鍵跳到[建立]功能表,再按Tab鍵一次到[上傳]功能表,按向下鍵到[檔案]後Enter。
5.出現[上傳檔案]對話方塊,請選取你要辨識的圖片或PDF檔案後Enter。
6.接下來會出現[上傳設定]對話方塊,按Tab鍵到[將文件、簡報、試算表以及繪圖轉換為符合「Google 文件」的格式]核取方塊並勾選,然後按一次Tab鍵到[文件語言]下拉方塊,按上下鍵選擇欲辨識文件的語言種類。
7.完成上述設定後按Tab鍵到[開始上傳]按鈕Enter。
8.上傳過程中NVDA有進度提示音效,完成後會有完成的提示訊息,檔案已轉換為Google文件格式。
9.按G,L跳到檔案與資料夾清單,按上下鍵找到辨識過的圖片或PDF檔案,雖然你會讀到和原本上傳的檔案一樣的檔名和副檔名,但請注意在副檔名後有提示[文件]而非[圖片]或[PDF],表示該檔案已經是Google文件格式而非原本的檔案格式,按X鍵選擇該檔案,會提示[selected]。
10.下載選取的檔案,按A鍵跳到[其它]功能表,按向下鍵到[下載]Enter。
11.出現[轉換和下載]對話方塊,按Tab找到下拉方塊,按上下鍵選擇要儲存的格式如 Word或文字檔等。
12.按Tab鍵到[下載]按鈕Enter將檔案儲存至你的電腦,如此便可以熟悉的方式閱讀辨識後的內容了,如果儲存的是Word等可包含圖文的檔案格式,則原本的圖片或PDF文件可能會在前面,後面才是辨識過的內容。
13.上傳的原檔案和辨識後產生的檔案若不再需要可以刪除,移動上下鍵並按X鍵選定檔案後再按A鍵跳到[其它]功能表,按向下鍵到[移除]Enter。


新版雲端硬碟:
1.進入雲端硬碟後,NVDA會自動轉為焦點模式並且跳至檔案和資料夾檢視的位置,若無則請按NVDA+空格鍵切換為焦點模式,此為重要的一步,在雲端硬碟中須切換為焦點模式才能順利使用。


註:在Google雲端硬碟中檔案與資料夾的檢視方式分清單與格狀兩種,建議設為清單檢視以利後續操作,在瀏覽模式下按B鍵找到[清單檢視]按鈕Enter切換,切換後會直接跳到檔案與資料夾清單的位置且NVDA會轉為焦點模式,若切換後沒有上述的情況,請按NVDA+空格鍵切換為焦點模式。


2.按C鍵跳到[新增]功能表,按向下鍵到[檔案上傳]後Enter。
3.出現[上傳檔案]對話方塊,請選取你要辨識的圖片或PDF檔案後Enter開始上傳。
4.上傳過程中NVDA有進度提示音效,完成後會有完成的提示訊息。
5.先按G鍵後再按L鍵可跳到檔案和資料夾清單的位置並會提示[資料夾清單檢示],按上下鍵找到剛上傳的圖片或PDF文件。


註:這裡的G和l並不是如同一般我們在按各種快速鍵的按法,而是依序按G鍵後放開再按L鍵放開。


6.按快顯鍵叫出快顯功能表,往下到[選擇開啟工具]右鍵展開子功能表,往下到[Google文件]Enter。
7.此時將會進行辨識並在新分頁中以Google文件格式呈現辨識後的結果。
8.按Alt+Shift+F鍵跳到[檔案]功能表,按向下鍵到[下載格式]右鍵展開子功能表,按上下鍵選擇想要存檔的格式後Enter將檔案儲存至你的電腦,如此便可以熟悉的方式閱讀辨識後的內容了,如果儲存的是Word等可包含圖文的檔案格式,則原本的圖片或PDF文件可能會在前面,後面才是辨識過的內容。
9.按Ctrl+W關閉Google文件分頁,回到雲端硬碟分頁,按G,L跳到檔案與資料夾清單,按上下鍵找到辨識過的圖片或PDF檔案,雖然你會讀到和原本上傳的檔案一樣的檔名和副檔名,但請注意在副檔名後有提示[Google文件]而非[圖片]或[PDF],表示該檔案已經是Google文件格式而非原本的檔案格式。
10.這些上傳的原檔案和辨識後產生的檔案若不再需要可以刪除,上下鍵選定檔案後按快顯鍵叫出快顯功能表,按向上鍵到[移除]Enter。


不論以哪一種方式完成上傳辨識轉換和下載作業後要登出雲端硬碟,請按NVDA+空格鍵切換回瀏覽模式,按Ctrl+Home將焦點移到最前面,按K鍵到自己登入的帳戶名稱連結上,Enter鍵展開子功能表,再按K鍵到[登出]連結Enter即可。


附註:
1.當以Adobe Reader開啟PDF文件,若有提示[警告:空文件  編輯區  此文件似乎為空。它可能是一個需要 OCR 處理的掃描的影像或結構畸形的文件。  唯讀],表示該文件很有可能為影像格式,這類的PDF檔案NVDA無法讀取內容,需經過辨識後才能閱讀。
2.可接受辨識的圖片(.jpg、.gif、.png)和PDF檔案(.pdf)的檔案大小上限為2MB,文字方向須為橫向且由左至右排列,PDF檔案只會針對前10頁進行辨識。
3.辨識後的內容其樣貌將無法和原本的檔案樣貌一致,文字格式和結構元素(例如項目符號和編號清單、表格、文字分欄以及註腳或章節附註)很可能會遺失。
4.圖片的解析度、顏色對比、明暗等因素皆會影響辨識正確率,辨識結果可能無法完全正確,只要錯誤率不高仍然可掌握圖片資料內容。