Information
[情報] XMLのルール
XMLを作成する上で知っておくとよいルールをかき集めてみました。
HTMLと比較すると、
- HTMLに似たタグベースで記述します。
- HTMLは、タグの意味があらかじめ定義されているのに対し、
XMLでは、独自にタグの意味を定義する事ができます。
- XMLでは、あらかじめ定義されたルール(XHTML等)を使用する事もできます。
- XMLでは、終了タグを省略する事ができません。(中身が空の場合は、空要素タグを使用できます)
- XMLでは、タグ名の大文字・小文字の違いを判断します。
- XMLでは、属性値を引用符で囲む必要があります。
タグ名、属性名のルール
| ルール |
内容 |
| 先頭で使える文字 |
アルファベット、ひらがな、カタカナ、漢字、半角英字、アンダースコア(_)、コロン(:) |
| 2文字目以降で使える文字 |
先頭で使える文字、半角数字、ピリオド(.)、ハイフン(-)、結合文字、エクステンダー |
| 使えない文字 |
半角カタカナ、全角数字、全角英字 |
| 予約語 |
「xml」は、予約語になっているので、名前の先頭では使用できません。(大文字・小文字に関係なく使用不可) |
| その他 |
コロン(:)は、使用できますが名前空間と紛らわしいので、使用しない方がよい。 |
XMLマークアップの種類
| 種類 |
例 |
| 実体参照 |
&…; |
| 文字参照 |
&#…; |
| コメント |
<!-- … --> |
| CDATAセクションの区切り子 |
<![CDATA[…]]> |
| 文書型宣言 |
<!DOCTYPE … > |
| 処理命令 |
<?… …?> |
| XML宣言とテキスト宣言 |
<?xml… …?> |
XMLで使えない文字のエスケープ(実態参照、文字参照)
| エスケープ文字 |
置き換わる文字 |
| < |
< |
| > |
> |
| & |
& |
| " |
" |
| ' |
' |
| 
進数文字コード; |
ISO/IEC10646(Unicodeとほぼ同じ) 10進数の該当文字 |
| 進数文字コード; |
ISO/IEC10646(Unicodeとほぼ同じ) 16進数の該当文字 |
「整形式XML」と「妥当なXML」の意味
- 整形式XML:タグの書き方が妥当な文書。
- 妥当なXML:整形式XMLでかつ、DTD等に照らして妥当な文書。
|