文字コード
読み方:もじコード
【英】character code
文字コードとは、文字をコンピュータで扱うために個々の文字や記号に割り当てられた、固有の番号のことである。
文字コードはコンピュータと共に発展し、欧米で最初に確立された。欧米では英数字のみの文字コードが用いられ、どれも1バイトの情報で表現される。1バイトの文字コードとしてはASCIIが世界標準となっている。ASCIIは最大256文字まで表現できる。
コンピュータの普及により、ASCIIのような1バイト文字では漢字のような文字体系を収録することはできないという問題点が露見したため、漢字を用いる国では各国独自にコード体系を定めてそれぞれ使用している。文字コードには2バイト文字が用いられる。2バイト文字を定めると最大65536文字まで収録できる。Unicodeは、世界のほとんどの主要な言語をサポートした2バイト文字で、文字コードを世界的に統一するものとして期待されている。JavaなどにはUnicoodeが実装されている。
日本語の文字コードは、日本工業規格(JIS)で標準化されたJIS X 0208(JISコード)、EUC(EUC-JP)、シフトJIS(Shift_JIS)が主に利用されている。
参照リンク
Unicode Home Page
日本語と文字コード ~The web Kanzaki
文字・活字文化の日キャンペーン - 文字
|