テキスト
別名:テキストデータ
【英】text, text data
テキストとは、コンピュータの画面に表示可能な文字情報のことである。単に文字列の意味で用いられることも多い。
テキストは、開始位置から終了位置まで、線形に1次元に流れていく形のデータを表すものである。特に、フォントとして表示可能な文字の1次元的な集合のことを指す。
テキストのデータで構成されるファイルは、テキストファイルと呼ばれる。テキストファイルの中のデータは、改行、および、タブなどのいくつかの制御文字が含まれ、それ以外はほぼフォントとして表示可能な文字の表示のみに用いられる。テキストファイルを編集するためのツールは、テキストエディタと呼ばれる。
テキストのうち、表示可能な文字列と、改行などの一部の制御情報のみを含むテキストデータは、特にプレーンテキストと呼ばれる。プレーンテキストに対して、フォントの色や下線、強調文字といった装飾的表現を可能にする属性を含んだデータは、リッチテキストと呼ばれる。
コンピュータ上では、テキストは文字コードを手掛かりとしてバイト列から表現されている。英数字を扱う文字コードとしては、US-ASCIIが代表的である。日本語のテキストを扱うための文字コードとしては、JISコード(JIS-2022-JP)、Shift-JIS、EUC、UTF-8、などがある。テキストエディタなどでテキストファイルを読み出す際に、異なる文字コードで読み出すと、文字化けが起きる場合がある。
ちなみに、テキストファイルにおける改行などの制御コードも、環境によって違なる。例えば、Unixでは「LF」(16進数の0A)、Windowsでは「CR+LF」(16進数の0D+0A)、Macintoshでは「CR」(16進数の0D)となっている。
テキスト以外の音声、画像、映像といったデータの表現は、テキストに対してマルチメディアデータと総称される。
テキストの任意の部分を指定して、他の文書へジャンプさせることができる仕組みは、ハイパーテキストと呼ばれる。ハイパーテキストの概念は、リンクで結ばれた現在のWebの根本的な考え方となっている。
なお、文字情報を主に扱うアプリケーションソフトとしては、テキストエディタの他にもワープロソフトがある。ワープロソフトでは、通常のテキストエディタでは表示できないバイナリデータを含む書式を持っているため、テキストエディタは再現できない。
|