前往主要內容區

NVDA部落

Whisper03 — 一些小補充與如何有效運用轉換出來的檔案

上架日期:2025-07-15
學習交流
沈彥霖

文/沈彥霖

 

這是 Whisper 系列的最後一篇,前面的兩篇文章,我們從軟體介紹、下載到使用,各位讀者是否已經能靈活運用,讓Whisper 成為你生活中的好幫手呢?這系列的最後一篇,我將介紹 Whisper 的補充小功能,還有我如何使用這些轉換出來的檔案,想了解的讀者們,就繼續看下去吧。

Whisper 也能幫你翻譯?

當我們在 Whisper 的 Language:下拉式方塊,選擇完聲音檔的原始與延後,按一下 Tab 會有個 Translate 的核取方塊,將他打勾,並點選 Transcribe,出來的檔案就會是已經翻譯後的結果,不過該功能目前僅支援將語言翻譯成英文,所以,對於英文不錯的夥伴,是個好用的工具。

當然,我們也可以將例如法文的聲音檔轉換完畢後,上傳到 Google 翻譯等軟體進行處理,不過根據筆者的經驗,若要完全理解或者翻譯的OK,建議將你看不懂的語言讓 Whisper 翻譯成英文再透過其他翻譯軟體去理解,效果會比較好。

Whisper 的 Audio Capture:

在軟體介面上,按 Tab 會看到一個 Audio Capture 的按鈕,按下 Enter 之後就會切換到另一個介面,長得跟Transcribe File 的介面有點像,這個介面是Whisper 的聲音擷取介面,我們可以透過麥克風,將想說的話,或是想轉錄的內容進行輸入,讓軟體來幫你轉換成文字,這對於靠靈感創作,或是想即時記錄想法又不太想透過打字記錄的讀者非常好用。

在這個介面中,有幾個選項來與各位讀者進行說明:

  • Capture device:選擇你要輸入聲音的裝置。
  • Save to text file:將即時轉換後的內容儲存為文字檔。
  • Include timestamps:在每句話前面加上時間戳記。
  • Capture:錄音的按鈕,在此按空格鍵後可進行聲音的錄製,再次按下該按鈕,就會將錄製好的聲音轉換完,呈現在新開的記事本當中。

備註:若要回到一開始的 Transcribe file 頁面,在主介面上,按幾下 Tab 聽到 Transcribe File 按鈕,按下 Enter 就可以回到 Transcribe File 的頁面囉。

如何更換 Whisper 模型:

本系列的第一篇文章中,提到關於模型的選擇與使用,也提到會與各位讀者們說明如何更換模型讓你轉換出來的文字檔是品質穩定的。

  1. 若在軟體的主介面,請按 Tab,聽到語音報讀(Back 按鈕)按下 Enter。
  2. 會跳出 Load Whisper Model 的對話框,按 Tab 聽到一個沒有名稱的按鈕,按下空格鍵,就會跳出開啟檔案的對話框,此時,就可以在此選擇新的模型,選擇完後,按 Enter 回到 Load Whisper Model 的介面。
  3. 可按 Tab 到 Model Implementation 再次確認是使用 CPU 或 GPU 進行運算,確認無誤後按 Tab到 OK,按下 Enter 就會回到 Whisper 的主介面,此時運算所使用的模型,就會是你新更換的模型了。

AI+AI,讓你用最快速的方式找到重點

現在大多的 AI 工具,例如:ChatGPT、Gemini 等等,都可以擷取網頁資料,除了文字以外,像是 Youtube 的影片,AI 也能將它整理重點並且輸出讓讀者了解,而有另一種的情況是,你拿到一個演講、特定產品的使用錄音,那可怎麼辦?

雖然現在的 AI 工具可以上傳聲音檔讓它解析,但也有檔案大小的限制,因此,透過 Whisper 轉換成文字,再上傳到 AI 工具進行分析與整理重點,是筆者比較建議的方式。

在此,我提供一個國泰ATM 本行存款操作的 MP3 檔案供各位讀者練習,雖然檔案比較短,可能無法有較大差異,但至少知道如何善用工具,才是本篇文章的重點,以下分別提供我轉換的結果,與透過AI 工具整理的結果。

Whisper 輸出的內容:

這一段要錄的是

我們也是一樣

存款就是將款項存到博泰本身的帳戶

那我一樣現在在ATM這邊

我先把卡片放進去

我一樣按0進入無障礙模式

我先打密碼

(請選擇55項目)

存體款是1對不對

(請選擇55項目)

存款是5

進來之後如果要存到博泰的帳戶

是按2對不對

(請輸入帳號)

那我輸入我博泰的帳號

然後按確定

(請輸入帳號)

好那如果沒問題就按確定

它的虛擬鍵是多少

它的虛擬鍵是8

8或是直接按實體確定

(請放入手機)

假設我把鈔票放進去

(放入手機後請按確定鍵)

好我放好按確定

(否則機器輸入手機收口)

(機器輸出手機收口)

(確認乘入金額)

確定7或是實體鍵都可以

好這樣就完成

等一下我們就等卡片可以出來

(請取回卡片)

那如果我現在不顯示不列印的話

(請選擇續管4)

也是跟剛才一樣也是4

整個過程就到這邊結束

Gemini 整理的重點:

我:請告訴我這個檔案的重點

Gemini: 這個檔案的重點是描述使用國泰 ATM 進行本行存款(將款項存入國泰自身的帳戶)的操作步驟,過程是透過語音導覽(無障礙模式)來進行的。

以下是主要的步驟:

1.插入卡片並進入無障礙模式

•將卡片放入 ATM。

•按 0 進入無障礙模式。

•輸入密碼。

2.選擇存款服務

•選擇存款的選項,對應的數字是 5。

3.輸入存款帳號

•如果選擇存入國泰本身的帳戶,按 2。

•輸入國泰的帳號。

•按確定(虛擬鍵是 8 或實體確定鍵)。

4.放入鈔票並確認金額

•放入鈔票。

•放好後按確定鍵。

•確認存入的金額,按 7 或實體鍵確定。

5.完成交易與取回卡片

•交易完成後,等待並取回卡片。

•如果選擇不顯示/不列印收據,按 4。

ChatGPT 整理的重點:

我:請告訴我這個檔案的重點

ChatGPT: 以下是 你提供的檔案《國泰 ATM 本行存款》內容的重點整理,我把它濃縮成清楚易懂的步驟:

📌《國泰 ATM 本行存款》重點摘要

這段內容是在示範:
如何使用國泰 ATM(無障礙模式)進行本行帳戶存款。

⭐ 操作流程重點

  1. 插卡→進入無障礙模式
    • 將卡片插入 ATM
    • 0 啟動無障礙語音模式
    • 輸入密碼
  2. 進入存款功能
    • 系統語音提示後
    • 選擇 5(存款)
  3. 選擇存入本行帳戶
    • 存入國泰(博泰)本行帳戶→按 2
  4. 輸入帳號
    • 輸入要存入的本行帳號
    • 按確定
    • 虛擬鍵為 8(或按實體確定鍵)
  5. 放入鈔票
    • 將鈔票放入存款口
    • 放好後按確定
    • 機器會收鈔、點鈔
  6. 確認金額
    • 金額正確→按 7(或按實體確定鍵)
  7. 完成與取卡
    • 等待機器處理
    • 畫面提示後取回卡片
  8. 是否列印收據
    • 若不列印→按 4
    • 與先前的操作一致

🎯 一句話總結

這段內容主要是在示範視障者如何使用 國泰 ATM 無障礙語音模式,操作流程包括:插卡→無障礙模式→選存款→選本行帳戶→輸入帳號→放鈔→確認金額→取卡→選擇是否列印收據。

結尾:

透過上述的示範,我們體會了工具帶給我們的便利性,在現今資訊爆炸的時代,一個工具用的好叫厲害,多個工具搭配的好叫做事半功倍,希望藉由這一系列的分享,讓各位讀者們有所收穫。

回頂端
Loading...