XMLとスキーマ

* XMLとスキーマ * PPL Summer School 2004

via 読書記録ChangeLog

なんだか楽しそうなことが書いてありそうなんだけど、よくわからない・・・orz.

とりあえず気になるところを引用しておく。

> スキーマと意味? > スキーマは、文書の意味を規定しない

> XML文書全体の集合の部分集合を規定しているだけ

> DTDに適合する文書を扱うスタイルシート、ソフトウェア、人間の総体が意味を規定する

スキーマは、世界中にあまたあるXML文書を、

* スキーマに合致したXML文書 * スキーマに合致しないXML文書

の2つに分類するだけ。

> 別の見解 > スキーマは,integerすら持たないXML文書を、型情報を備えたオブジェクトへと昇華させる > 効率は負ける > 誤ったレイヤリングである

「誤ったレイヤリング」の「こころ」はなんだろう????

> スキーマの理論

よくわからない・・・が、楽しそう。キーワードだけ並べておく。

* 正規木文法 * 木オートマトン * 正規文法 * 文脈自由(列)文法 * Chomsky Hierarchy * 局所文法(local grammar)

> 課題1: スキーマの汎用化と特殊化 > […]

XMLデータベース開発方法論

* @IT:XMLデータベース開発方法論(1) 1/4 * @IT:XMLデータベース開発方法論(1) 2/4 * @IT:XMLデータベース開発方法論(1) 3/4 * @IT:XMLデータベース開発方法論(1) 4/4

面白い。

from @IT:XMLデータベース開発方法論(1) 2/4 :

> RDBは「例外的な処理」との相性が悪いということである。きれいに正規化されたデータを扱っている限り、RDBは実に快適で、わずかな手間で素晴らしい成果をもたらしてくれる。しかし、そこから逸脱する例外的なデータや、例外的な処理が発生すると急に扱いにくくなる。そして、例外的なデータや例外的な処理は、多かれ少なかれ、どこかで要求に入り込んでくる。

(筆者を批判するわけでなく・・・)より正確に言えば、上記の批判(というか制約か・・・)はRDB特有のものではない。厳密な意味にでの「データモデル」を扱った場合に一般の問題といえると思う。

from @IT:XMLデータベース開発方法論(1) 3/4 : AWK、使い捨てデータ処理の切り札 > AWKによるデータ処理は、RDBによるデータ処理の対極に存在するといってよいだろう。RDBによるデータ処理は、専門家によって構築され、大量の定型化された情報を効率よく処理し、日常業務の中で数え切れないほど繰り返し長期にわたって使うことができる。しかし、AWKによるデータ処理は、ユーザー自身が記述し、少量の不定形の情報を効率は悪くとも必要十分な時間で処理し、使い捨てられる。

from @IT:XMLデータベース開発方法論(1) 4/4 : RDBとAWKの中間ポイントに位置するXML

> XMLとは、テキストでデータを記述するというAWK的テキスト処理の世界を継承しつつ、そこに要素や属性という構造を導入することで、自由を制約した言語であると見ることができる。自由の制約は、利用者がより少ない手間で成果を得られるようにするために導入される。しかし、自由の制約は最小限に抑えられ、RDBと同水準の高い秩序は要求していない。

筆者の立場は、XMLを、厳密な意味での「データモデル」として捕らえたものではない。逆の立場をとっている。(モデルとして)全くの構造を持たないテキストデータに対して、制約を加えたものという立場をとる。まさにボヘミアン。

役にたたないXML Schema

私よりW3C XML Schemaが嫌いな人たち : 村田 真のチャンネル -北国tv

> 調べた人の話によると、Webに公開されているW3C XML Schemaスキーマのうち2/3には文法エラーがあり、何の役にも立たないのだそうな。

(笑)。

XML Schema問題の要約の要約

大ざっぱで当てにならないW3C XML Schema問題の要約

### 過剰な複雑さと基本構造のいびつさ > W3Cという組織は、自らがXML Schemaを勧告している関係上、建前としてスキーマをXML Schemaで書かねばなりません。その結果、W3Cで行われている多くの言語作成活動においてXML Schemaによるスキーマ作成が行われ、その結果として上手く書けない事例がいくつも発生しているとされています。

XMLのプロフェッショナルであるはずのW3Cに関与する人間すら、XML Schemaを使えていない現実!

### PSVI問題 Post Schema Validation Infoset問題。 同じXML文書でも、XML Schemaを通さなかった場合と、XML Schemaを通した場合でInfosetが変わってきてしまう問題(XML Schemaのデフォルト値の適用)

* 参考 : 『XMLにおける「ボヘミアンと貴族の階級闘争」を読み解く』を読み解いてみたら例示が欲しくなりました – XML & SOA

### 特定される単一のスキーマ > XML Schemaは、1つの名前空間に対応するスキーマが1つ存在するという前提を取るアーキテクチャであると言われています。

たしかに1つの文書に複数のスキーマを割り当てたいケースもあるかも。 データと妥当性を分離した、妥当かどうかもContextに依存させるような疎結合なアーキテクチャを実現したいケースもありそう。

### 貴族とボヘミアンの対立問題 > XML Schemaは、全てのXML文書に対応するスキーマが存在し、読み込む際には必ず検証を行うアーキテクチャを前提としていると言われます。つまり、検証しない使用法を全て認めないことを理想としていると考えられます。

> ここで注意すべき点は、ボヘミアンの立場がスキーマ不要論ではないことです。スキーマには、使うべき時と、使わない方が良い時がある、という立場です。

現場では、柔軟にXMLを使用したいはず。

### W3Cの権威 > 世界におけるISOにせよ、日本国内におけるJISにせよ、その権威は本来W3Cより高いものであるにも関わらず、WWWの世界ではW3Cが最も権威を持つかのような錯覚が一部にあって、それが盲目的なXML Schema支持につながっている面があります。

W3Cが論理的で理性的な判断を下せない理由は何か?

Russian Doll と Salami Slice

スキーマ設計とクラス図 | ノート

なるほど。興味深い。

同じことを書くのに、ちょっと自由度があるのがイヤンなかんじもするな。

The Data Administration Newsletter (TDAN.com)

The Data Administration Newsletter (TDAN.com)

何の気なしにGoogleしてたら見つけた。なかなか面白い。

適度に概念的で、それなりに実際的なレベルの議論で楽しい。こういうのは、日本では読めない。 ヨコのものをタテにするのが商売の連中か、電波を飛ばすのが趣味の連中ぐらいしかメディアにいないから。 いや、いるにはいるのだけど、適切な具体的レベルで言葉を発することができないのだ。 残念なことだ。

### XML 関連 ### 個人的にもやもやしていているが、自分では表現できないことを代弁してくれる記事に出くわすと、とてもありがたく感じる。

* TDAN – Mullins – DBAs You Should Fear XML * TDAN – Riggs – What XML Means