原來之前是踩到這個地雷,超痛的…>"<

簡單來說就是 M$ 在使用 Windows 2000 (含)以後版本「記事本」儲存 UTF-8 檔案的時候,為了要能夠識別 UTF-8 和 ASCII 檔案,於是加上了 BOM 來辨別。 Orz

(參考維基百科 Byte-order mark 的說明,或者 google "UTF-8 BOM" )

雖然打開的時候看不見 BOM ,可是依舊存在…

在某些需要讀取文字檔的環境下就會中獎了。

解決的方式有幾種,一種是在存檔的時候存成「 UTF-8 without BOM 」或是「 UTF-8 without signature 」,另一種就是由需要讀取文字檔的程式去解決。網路上已經有不少人寫了濾掉 BOM 的程式了。

 


Tags: UTF-8 BOM UTF8 Unicode 亂碼 記事本 Notepad


創作者介紹

旅行的記憶

repeat<">< 發表在 痞客邦 PIXNET 留言(0) 人氣()