來看看 Google 圖片文字說明

分類:學習交流   2020/12/24

文/ 陳鵬安


在先前的文章中,我們曾經介紹如何利用 Win10 內鍵的 OCR 文字辨識功能,其中一個主要的用途是讓我們利用它來辨識那些在網路上沒有文字描述的圖片,幫助我們得知圖片上有哪些文字。

而今天要介紹給各位的 OCR 功能,是由 Google Chrome 瀏覽器所提供,它能夠嘗試將那些沒有替代文字的圖片辨識出來。小編實際使用下來,發現效果還算不錯,甚至有些需要驗證碼的網站也可以利用此方式成功登入,今天我們就試舉一個例子來認識要如何使用它。


開啟測試網站

首先開啟 Google Chrome,搜尋關鍵字「網路郵局」,接著連至其首頁,我們將用此網站來測試辨識的功能。

然後按一下 G 跳到圖片,此時你可能會聽到 NVDA 報讀「未標示的圖片 如要為缺少說明的圖片取得說明,請開啟內容選單」,這就表示該張圖片沒有加上替代文字。


開啟「從 Google 取得圖片說明」

此時,要開啟圖片說明功能,先按下快顯鍵開啟快顯功能表,接著找到「從 Google 取得圖片說明」,展開後有兩個選項。

「一律使用」表示之後無論我們瀏覽到哪個網頁,凡是遇到沒有說明的圖片,Google 均會自動協助我們做辨識。若經常需要用到此功能,建議可以選擇「一律使用」。

「只有這一次」則是僅辨識目前網頁上的圖片,若重新整理或離開網頁,此功能則會關閉。

我們選擇「一律使用」後按下 Enter,它會跳出說明的對話框,選擇「是,我要啟用」。


此時重新回到圖片上,聽聽看 NVDA 是否有報讀類似:圖片上的文字似乎是「網路 郵局ipost.post.gov.tw」的訊息呢?若可以,表示辨識成功了。

事實上,只要在任何網頁,按下快顯功能表皆可以開啟此功能,若要關閉,則可重新點選「從 Google 取得圖片說明」,將原本勾選的狀態取消即可。


辨識驗證碼

同樣在此頁面,我們利用單鍵導航按 E,將焦點跳到編輯區,找到有提示「共四碼」,這裡即是讓我們輸入圖片驗證碼的地方。

若此時是有開啟圖片說明功能的狀態,則將游標往下,可以讀到辨識後的內容是:「圖片上的文字似乎是: XXXX」。

若系統正確辨識出四位數字,極可能就是正確的答案,但如果辨識結果不足四位或有其他符號,則我們可以將頁面重新整理,再試一次看看。


因此,若你之後在其他需要輸入驗證碼的網頁上,且我們已經知道驗證碼固定的位數,便可以使用此功能來試著辨識驗證碼喔!


相關閱讀: