第112回:Webテキスト処理法(その3)

未分類

 今回は、「HTML」について。

前回触れたように、HTML(Hyper Text Markup Language)はWebの記述言語である。HTMLの特徴としては、「開放的」「URLの利用」「テキスト形式」などが挙げられる。
HTMLには、いくつかのバージョンが存在する。

HTML 2.0: IETF によって作られた最初のHTML
HTML 3.2: 様々なバラエティを取りまとめたHTML。テーブルやアプレットなどが追加
HTML 4.0: 基本哲学に基づき整理し直したHTML。Transitional, Strict, Framesetの3つの仕様
HTML 4.01: HTML4.0の不具合を修正
XHTML 1.0: HTML4.0をXML化
XHTML 1.1: モジュール化
XHTML 2.0: よりXMLに近づけた。(現在、策定中)
HTML 5: HTML4の機能強化。(現在、策定中)

HTMLが「Webの内容を記録するためのタグを集めたもの」であるのに対し、「内容がどのように表現されるのか」を記録したものをスタイルシートと呼ぶ。一般的に「CSS(Cascading Style Sheet)」がこれにあたる。

またHTMLで記述する際に、無意識のうちに誤ったタグの使い方をしていることも少なくないそうだ。例えば、文章中で太文字による強調を加えたいとき、「This is <b>very important</b>.」とすることが多いが、これは正しいタグの使い方ではない。正しくは、「This is <strong>very important</strong>.」とする。表現方法ではなく、あくまでも意味をマークアップするのである。何気なく使っているタグも、こうした意味を認識した使い方をすることで、より一層効果的に使うことができる。

慶應義塾大学 環境情報学部 水谷晃毅