HTML
フルスペル:Hyper Text Markup Language
読み方:エイチティーエムエル
別名:ハイパー・テキスト・マークアップ・ランゲージ
HTMLとは、Web上で公開される文書の論理構造、レイアウト情報、および、他の文書やデータとのリンク関係などを定義するために用いられる標準的な書式のことである。
HTMLは、マークアップ言語と呼ばれる言語の一種であり、テキストを構成する各部分にタグを付与(マークアップ)することによって文書構造が指定されている。例えば、<html>と</html>のように、「開始タグ」と「終了タグ」をセットとして、文書中の各部分を囲み、その部分に特定の論理的意味や表示効果などを指定できる。また、音声や画像、映像データといった外部データを読み込む指示を記述することができ、これによってさまざまなデータの統合も可能となっている。
マークアップによって指定できる個々の単位は、「要素」と呼ばれる。各要素の内容は、DTD(Document Type Definition)と呼ばれる定義用文書によって定義されている。また、各要素の開始タグは、「属性」と呼ばれるそのタグ固有の特性を同時に持つことができる。
HTMLは、他の文書とのリンク関係を示すことができるという点から、ハイパーテキストを実現する代表的な書式ともなっている。世界中のHTML文書がリンクによって連携することで、さまざまな情報を一般に公開する適切な手段となり、World Wide Webの世界が実現されている。ちなみに、Webが登場する以前は、情報交換の手段としては、電子メールによるデータの送信やFTPを用いたファイルのダウンロードなどが登場していた。いずれにしても、宛先を特定して個別にデータにアクセスする方式である。
HTMLの仕組みは、1960年代に、テッド・ネルソンが構想を表したハイパーテキストの概念を基に、CERN(欧州合同素粒子原子核研究機構)の研究者であったティム・バーナーズ・リーによって開発・公開された。1990年に、リーによって発表された文書構造が、HTMLの最初のバージョンとされている。当初、HTMLはCERN内の学術情報の交換に用いられたが、その潜在力は非常に大きく、1992年に、HTML用の閲覧ソフト(Webブラウザ)が開発され、1993年頃に、インターネット接続サービスが登場し始めたことなどを背景に、HTMLは情報公開用の文書交換フォーマットとして爆発的に普及することになった。
今日、HTMLはWebページを表現するための手段として一般的に用いられている。仕様は、W3Cのワーキンググループによって標準化が進められている。
なお、HTMLのマークアップ形式は、1986年に、ISO標準として定められたSGML(Standard Generalized Markup Language)の考え方に準じている。しかし、Webブラウザによる仕様拡張が進んだ末、HTMLの規格は、SGMLが目指していた「論理構造とレイアウト構造の分離」という趣旨とは相容れない部分を含むようになり、HTML 4.0以降、その仕様に対する批判が強まっていた。その結果、HTMLは、SGMLの後継として単純化しつつ再構成された汎用のマークアップ言語であるXML(Extensible Markup Language)により厳密に再定義されたXHTMLと、併せてもっぱらレイアウトを規定するための文書であるCSS(Cascading Style Sheets)との組み合わせによる文書作成が提案された。
XHTMLとCSSの体系では、XHTMLは、あくまでも文書の論理構造を記述し、表示上の配置、大きさ、色、装飾などはレイアウト要素としてCSS上に記述するようになっている。XHTMLとCSSは、メンテナンス性にも優れ、コンテンツの内容面と、見栄えの部分(デザイン要素)を、独立に管理することができるというメリットを持っている。
HTMLを表示するWebブラウザは、HTMLの規約違反に対して比較的寛容であり、相当の違反が存在しても、表示だけはできるケースが多い。その反面、誤った仕様やWebブラウザ間の互換性に欠けるHTMLが普及してしまうという現象が生じている。HTMLの記述の際には、W3Cやその他のWebサイト上で提供されている、文法チェックや規約への準拠度(Validation)を判定するサービスを利用したり、複数の主要なWebブラウザで実際に表示を確認しながら記述を進めていくなどの作業が推奨される状況にある。
参照リンク
W3C HTML - (英文)
|