UTF-16BEとUTF-16LEの違い/確認する

UTF-16BEとUTF-16LE(+BOM付きとBOM無し)をサクラエディタとバイナリエディタで確認します。

目次

サンプル BEとLEとは
  UTF-16BEのBOM無し
  UTF-16LEのBOM無し
  UTF-16BEのBOM付き
  UTF-16LEのBOM付き

BEとLEとは

BEはビッグエンディアンでLEはリトルエンディアンの略です。

エンディアンはデータのバイトの並び方を意味します。
BEは、データを上位バイトから並べます。ABCは、0041,0042,0043です。
LEは、データを下位バイトから並べます。ABCは、4100,4200,4300です。

Windowsのメモ帳の保存では、UTF-16LEとUTF-16BEがあります。

 

UTF-16BEのBOM無し

1.サクラエディタで「ABC」の3文字を入力して「名前を付けて保存」からUnicodeBEを選択して保存します。

このUnicodeBEはUnicode big endianです。

 

2.バイナリエディタでファイルの内容を見ると0041,0042,0043があります。
これはテキストに入力したA,B,Cです。

 

UTF-16LEのBOM無し

1.サクラエディタで「ABC」の3文字を入力して「名前を付けて保存」からUnicodeを選択して保存します。

このUnicodeはUnicode little endian(LE)です。

 

2.バイナリエディタでファイルの内容を見ると4100,4200,4300があります。
これはテキストに入力した数値のA,B,Cです。

UnicodeBEでは、0041,0042,0043でした。

 

UTF-16BEのBOM付き

1.サクラエディタで「ABC」の3文字を入力して「名前を付けて保存」からUnicodeBEを選択しBOMにチェックをつけて保存します。

 

2.バイナリエディタでファイルの内容を見ると先頭にFE,FFがあります。
これがBOMです。

BOMとはByte Order Mark(バイトオーダーマーク)の略でファイルの先頭に付き、この場合はUTF16のファイルであることを知らせます。

 

UTF-16LEのBOM付き

1.サクラエディタで「ABC」の3文字を入力して「名前を付けて保存」からUnicodeを選択しBOMにチェックをつけて保存します。

 

2.バイナリエディタでファイルの内容を見ると先頭にFF,FEがあります。
これがBOMです。UTF-16BEのBOMはFE,FFなので順序が逆になっています。

BOMとはByte Order Mark(バイトオーダーマーク)の略でファイルの先頭3に付き、この場合はUTF16のファイルであることを知らせます。

関連の記事

UTF8のBOM無しとBOM付きの違い

△上に戻る