2バイト文字
読み方:にバイトもじ
別名:ダブルバイト文字
【英】Double Byte Character
2バイト文字とは、文字コードのうち、1文字を2バイトで表現する文字の総称である。一般的に、中国語、日本語、韓国語(CJK)の文字体系を指す場合が多い。
コンピュータにおいて、データは1バイトで256通りの情報を表現することができる。英語のアルファベットのような言語は、1バイトで充分に表現することができる。しかし、漢字のような言語は種類が膨大であるため、256種類では足りない。そのため、文字を表現するためにデータを2バイト利用し、256の2乗である65536通りの情報を表現可能とすることによって、実用的なレベルの文字表現を実現している。
2バイト文字に対して、アルファベットと記号を含んで1バイトで表現される文字は、1バイト文字と呼ばれる。日本語のワープロソフトでは、1バイト文字と2バイト文字を並存させることができる。
2バイト文字は、1バイト文字2個分の幅を持つ正方形に近い字形で表記される。このため、1バイト文字を半角、2バイト文字を全角と呼ぶこともある。2バイト文字の中には、英数字やカタカナといった、1バイト文字でも表現できる文字が含まれている。そのような、1バイト文字でも2バイト文字でも表現できる文字を区別するための表現として、半角カナ、全角英数字、などのように全角と半角の区別が利用されることが多い。
|