データ形式
文字種情報
属性値には、大文字小文字を区別するものとしないものがあり、
以下のキーワードで示します。
- CS
- 大文字小文字を区別します。
- CI
- 大文字小文字を区別しません。
- CN
- 数字などのため、影響をうけません。
- CA
- 型定義自体にに大文字小文字の区別があります。
- CT
- 区別するかどうかは型定義を参照。
基本形式
- CDATA
-
文書文字集合中の任意の文字列。改行、タブは、スペースに置き換えられます。
< や & などの文字もそのまま扱われ、
& などの文字実態参照もそのまま & と扱われます。
ただし、属性値として使われる場合のみ、文字実態参照が有効になります。
- #PCDATA
-
CDATA とは違い、< や & などの文字( マーク )は、特別な意味を持ち、
タグの区切りなどとして扱われます。
文字実態参照が有効なため & は、& に置き換わります。
- ID、NAME
-
使える文字は、アルファベット( A-Z a-z )、数字( 0-9 )、ハイフン( - )、
アンダースコア( _ )、コロン( : )、ピリオド( . )のみです。
また一文字目は必ずアルファベットでなければなりません。
大文字小文字にかかわらず、xml で始まる名前は使用できません。
また、コロンはできるだけ使用しないようにして下さい。
- NMTOKEN、NMTOKENS
-
NMTOKEN は、アルファベット( A-Z a-z )、数字( 0-9 )、ハイフン( - )、
アンダースコア( _ )、コロン( : )、ピリオド( . )のみで構成された文字列です。
NMTOKENS は、NMTOKEN をスペースで区切って複数指定することができます。
大文字小文字にかかわらず、xml で始まる名前は使用できません。
また、コロンはできるだけ使用しないようにして下さい。
- IDREF、IDREFS
-
IDREF は、参照する他の要素の id 属性名を指定します。
IDREFS は、IDREF をスペースで区切って複数指定することができます。
- NUMBER
-
一桁以上の数字( 0-9 )です。
テキスト ( Text )
人間が理解できる普通の文字列。
URI、URIs
URI を指定します。URI には、URLも含まれます。
ほとんどの環境で大文字小文字を区別します。また 非ASCII文字 は使えません。
URIs は、URI をスペースで区切って複数指定することができます。
色の指定 ( Color )
色の指定は #FFCC33 のように16進数で指定します。
シャープ ( # ) のあとに 00〜FF の範囲で赤、緑、青の順番で記述します。
また以下の色は、名前で指定することができます。
( これらの色のほかにもブラウザ固有の定義色がありますが、ここでは言及しません。)
長さの指定
- Pixels
-
ピクセル値を整数で指定します。
- Length
-
ピクセル単位または、パーセント( % ) で指定します。
- MultiLength
-
ピクセル単位または、パーセント( % ) をコンマ( , )で区切って複数指定が可能です。
また、「 i* 」という指定が可能で、「 i 」には整数が入ります。
ピクセル単位または、パーセントでの指定と組み合わせて使う場合、
まず最初にそれらの分を確保した後、残りの範囲を、
「 i 」の数値の割合で分配して確保します。「 1* 」は、ただ単に「 * 」と省略できます。
例えば、残りの範囲が60ピクセルのときに「 1*, 2*, 3* 」と指定した場合、
1対2対3の割合で分配するので、
「 1* 」には、10ピクセル、「 2* 」には、20ピクセル、
「 1* 」には、30ピクセルが確保されます。
コンテントタイプ ( MIMEタイプ )
リソースのデータ形式を
RFC2045 と
RFC2046
で定義された値で指定します。大文字小文字を区別しません。
text/html ( HTML文書 )
image/jpeg ( JPEG画像 )
image/gif ( GIF画像 )
video/mpeg ( MPEGムービー )
などがあります。
言語コード ( LanguageCode )
使用している言語を
RFC1766
で定義された値で指定します。
ja ( 日本語 ) ko ( 韓国語 ) en ( 英語 )
などがあります。
文字符号化方法 ( Charset )
文書で使用する文字コードを
IANA
で定義された値で指定します。
Shift_JIS ( シフトJIS )
ISO-2022-JP ( JIS )
EUC-JP ( EUC )
UTF-8 ( Unicode )
などがあります。
単一文字 ( Character )
任意の一文字を指定します。文字実体参照を使用することもできます。
日付と時刻 ( Datetime )
日付と時刻は
年:月:日T時:分:秒TZD
の書式で記述します。TZD とは、タイムゾーンのことで、
標準時(UTC:協定世界時)の時は Z、
標準時より進んでいるときは、+時:分、遅れている場合は、-時:分 とします。
日本時間は、標準時より9時間進んでいるので +09:00 とします。
標準時 2001年10月16日8時30分15秒は、
2001:10:16T08:30:15Z
となり、日本時間 2001年10月16日8時30分15秒は、
2001:10:16T08:30:15+09:00
となります。
リンク形式 ( LinkTypes )
リンク形式は、大文字小文字を区別しません。スペースで区切って複数指定が可能です。
- Alternate
-
代替文書を指します。
lang 属性とともに使う場合は、翻訳版文書を、
lang 属性とともに使う場合は、別メディア用の文書をそれぞれ指します。
- Stylesheet
- 外部スタイルシートを指します。
- Start
- 最初の文書を指します。
- Next
- 次の文書を指します。
- Prev
- 前の文書を指します。
- Contents
- 目次を提供する文書を指します。
- Index
- 索引のある文書を指します。
- Glossary
- 用語集を指します。
- Copyright
- 著作権表示を指します。
- Chapter
- 文書群の中の章である文書を指します。
- Section
- 文書群の中の節である文書を指します。
- Subsection
- 文書群の中の小節である文書を指します。
- Appendix
- 付録、付属書を指します。
- Help
- 詳説、ヘルプ文書を指します。
- Bookmark
-
ブックマークを指します。
文書内のアンカー( しおり )へのリンクに使用します。
各文書には複数のブックマークを定義することができます。
- screen
- コンピュータディスプレイ
- ttv
- テレタイプや携帯端末などの文字幅が固定されている装置
- tv
- テレビなどの解像度の低い装置
- projection
- プロジェクター
- handheld
- 携帯端末などのディスプレイの小さい装置
- print
- 印刷や印刷プレビュー
- braille
- 点字装置
- aural
- 音声読み上げソフト
- all
- すべての装置
スクリプト ( Script )
XHTMLでは、HTML4 とは違い、スクリプト内に、< や & などの文字を使用できなくなりました。
スクリプトでこのような文字を使いたい場合は、
CDATA マーク区間内に記述するか、外部スクリプトを使用して下さい。
大文字小文字を区別するかどうかは、スクリプト言語に依存します。
スタイルシート ( Stylesheet )
XHTMLでは、HTML4 とは違い、スタイルシート内に、< や & などの文字を使用できなくなりました。
スクリプトでこのような文字を使いたい場合は、
CDATA マーク区間内に記述するか、外部スタイルシートを使用して下さい。
大文字小文字を区別するかどうかは、スタイル言語に依存します。
下記の予約済み名称を除き、目標フレーム名の一文字目は、
アルファベット( A-Z a-z )でなければなりません。
- _blank
- リンク先を名前を持たない新しいブラウザウィンドウで開きます。
- _self
- 現在のフレーム又はブラウザウィンドウを指定します。
- _parent
- 親フレームを指定します。
- _top
- 最上位のブラウザウィンドウを指定します。フレームは解除されます。