文/吳志超
通常記事本編輯文字後都會存檔,偶而在存檔時會出現一個對話方塊,內容是提醒要儲存的內容包含Unicode字元,若以ANSI編碼方式儲存將會遺失Unicode字元,你可能很錯愕發生了什麼事,再熟悉不過的存檔動作竟然會出問題。
電腦上顯示和輸入的每個文字都有對應的字元編碼,早期電腦的字元編碼是採用ANSI格式,此格式能夠包含的文字數量有限,並無法容納全世界如此眾多的語言文字,因而有了Unicode格式的誕生,而Windows作業系統從Windows 2000以後採用的字元編碼為Unicode格式,該格式已歷經多個版本的更新,幾乎已囊擴了所有語言文字。
以繁體中文為例,早期所制定的BIG-5碼即為架構在ANSI格式下,而記事本預設的存檔字元編碼為ANSI,故所編輯的文字內容其編碼假如皆落在BIG-5碼的範圍,存檔時就不會出現如前所述的提醒訊息,換言之若有出現該訊息就表示所編輯的文字內容有包含Unicode編碼的文字,以預設的ANSI編碼方式儲存後再打開來看,將會發現Unicode的文字變成亂碼或消失,無法達到完整儲存的目的。
當輸入或貼上的文字為簡體中文或其它語言文字,想要完整保留內容不遺失任何文字,就不能以ANSI編碼存檔,而要改以Unicode編碼存檔,在記事本另存新檔對話方塊中,按Tab鍵可找到[編碼]下拉方塊,有多個編碼方式可選擇,基於通用性的考量,建議採「UTF-8」編碼方式存檔。
了解事情的原委之後,下次再遇到此狀況就能輕鬆應付不會再心慌慌了。