UTF-16BEとUTF-16LE(+BOM付きとBOM無し)をサクラエディタとバイナリエディタで確認します。
目次
サンプル | BEとLEとは |
UTF-16BEのBOM無し | |
UTF-16LEのBOM無し | |
UTF-16BEのBOM付き | |
UTF-16LEのBOM付き |
BEとLEとは
BEはビッグエンディアンでLEはリトルエンディアンの略です。
エンディアンはデータのバイトの並び方を意味します。
BEは、データを上位バイトから並べます。ABCは、0041,0042,0043です。
LEは、データを下位バイトから並べます。ABCは、4100,4200,4300です。
Windowsのメモ帳の保存では、UTF-16LEとUTF-16BEがあります。
UTF-16BEのBOM無し
1.サクラエディタで「ABC」の3文字を入力して「名前を付けて保存」からUnicodeBEを選択して保存します。
このUnicodeBEはUnicode big endianです。
2.バイナリエディタでファイルの内容を見ると0041,0042,0043があります。
これはテキストに入力したA,B,Cです。
UTF-16LEのBOM無し
1.サクラエディタで「ABC」の3文字を入力して「名前を付けて保存」からUnicodeを選択して保存します。
このUnicodeはUnicode little endian(LE)です。
2.バイナリエディタでファイルの内容を見ると4100,4200,4300があります。
これはテキストに入力した数値のA,B,Cです。
UnicodeBEでは、0041,0042,0043でした。
UTF-16BEのBOM付き
1.サクラエディタで「ABC」の3文字を入力して「名前を付けて保存」からUnicodeBEを選択しBOMにチェックをつけて保存します。
2.バイナリエディタでファイルの内容を見ると先頭にFE,FFがあります。
これがBOMです。
BOMとはByte Order Mark(バイトオーダーマーク)の略でファイルの先頭に付き、この場合はUTF16のファイルであることを知らせます。
UTF-16LEのBOM付き
1.サクラエディタで「ABC」の3文字を入力して「名前を付けて保存」からUnicodeを選択しBOMにチェックをつけて保存します。
2.バイナリエディタでファイルの内容を見ると先頭にFF,FEがあります。
これがBOMです。UTF-16BEのBOMはFE,FFなので順序が逆になっています。
BOMとはByte Order Mark(バイトオーダーマーク)の略でファイルの先頭3に付き、この場合はUTF16のファイルであることを知らせます。
関連の記事