WR blog

about Enterprise IT, Oracle Database, Jazz/Fusion Music, etc…

WR blog RSS Feed
 
 
 
 

Archive for XML

XMLとスキーマ

XMLとスキーマ PPL Summer School 2004

via 読書記録ChangeLog

なんだか楽しそうなことが書いてありそうなんだけど、よくわからない・・・orz.

とりあえず気になるところを引用しておく。

スキーマと意味?

スキーマは、文書の意味を規定しない > XML文書全体の集合の部分集合を規定しているだけ > DTDに適合する文書を扱うスタイルシート、ソフトウェア、人間の総体が意味を規定する

スキーマは、世界中にあまたあるXML文書を、

スキーマに合致したXML文書 スキーマに合致しないXML文書

の2つに分類するだけ。

別の見解

スキーマは,integerすら持たないXML文書を、型情報を備えたオブジェクトへと昇華させる > 効率は負ける > 誤ったレイヤリングである

「誤ったレイヤリング」の「こころ」はなんだろう????

スキーマの理論

よくわからない・・・が、楽しそう。キーワードだけ並べておく。

正規木文法 木オートマトン 正規文法 文脈自由(列)文法 Chomsky Hierarchy 局所文法(local grammar)

課題1: スキーマの汎用化と特殊化

広い範囲の人が合意するスキーマは複雑すぎて作れない >

日本の電子政府で必要な範囲の人名スキーマ

狭い範囲の人が合意するスキーマは広範囲の情報交換には使えない

UN/CEFACTやOASISで制定された人名(国際化)されたもの)とどう折り合いをつければいいのか?

双方向変換?

「広い範囲の人が合意するスキーマは複雑すぎて作れない」 うーむ・・・。

「XML処理手法と理論」XML [...]

XMLデータベース開発方法論

@IT:XMLデータベース開発方法論(1) 1/4 @IT:XMLデータベース開発方法論(1) 2/4 @IT:XMLデータベース開発方法論(1) 3/4 @IT:XMLデータベース開発方法論(1) 4/4

面白い。

from @IT:XMLデータベース開発方法論(1) 2/4 :

RDBは「例外的な処理」との相性が悪いということである。きれいに正規化されたデータを扱っている限り、RDBは実に快適で、わずかな手間で素晴らしい成果をもたらしてくれる。しかし、そこから逸脱する例外的なデータや、例外的な処理が発生すると急に扱いにくくなる。そして、例外的なデータや例外的な処理は、多かれ少なかれ、どこかで要求に入り込んでくる。

(筆者を批判するわけでなく・・・)より正確に言えば、上記の批判(というか制約か・・・)はRDB特有のものではない。厳密な意味にでの「データモデル」を扱った場合に一般の問題といえると思う。

from @IT:XMLデータベース開発方法論(1) 3/4 : AWK、使い捨てデータ処理の切り札

AWKによるデータ処理は、RDBによるデータ処理の対極に存在するといってよいだろう。RDBによるデータ処理は、専門家によって構築され、大量の定型化された情報を効率よく処理し、日常業務の中で数え切れないほど繰り返し長期にわたって使うことができる。しかし、AWKによるデータ処理は、ユーザー自身が記述し、少量の不定形の情報を効率は悪くとも必要十分な時間で処理し、使い捨てられる。

from @IT:XMLデータベース開発方法論(1) 4/4 : RDBとAWKの中間ポイントに位置するXML

XMLとは、テキストでデータを記述するというAWK的テキスト処理の世界を継承しつつ、そこに要素や属性という構造を導入することで、自由を制約した言語であると見ることができる。自由の制約は、利用者がより少ない手間で成果を得られるようにするために導入される。しかし、自由の制約は最小限に抑えられ、RDBと同水準の高い秩序は要求していない。

筆者の立場は、XMLを、厳密な意味での「データモデル」として捕らえたものではない。逆の立場をとっている。(モデルとして)全くの構造を持たないテキストデータに対して、制約を加えたものという立場をとる。まさにボヘミアン。

役にたたないXML Schema

私よりW3C XML Schemaが嫌いな人たち : 村田 真のチャンネル -北国tv

調べた人の話によると、Webに公開されているW3C XML Schemaスキーマのうち2/3には文法エラーがあり、何の役にも立たないのだそうな。

(笑)。

XML Schema問題の要約の要約

大ざっぱで当てにならないW3C XML Schema問題の要約

過剰な複雑さと基本構造のいびつさ

W3Cという組織は、自らがXML Schemaを勧告している関係上、建前としてスキーマをXML Schemaで書かねばなりません。その結果、W3Cで行われている多くの言語作成活動においてXML Schemaによるスキーマ作成が行われ、その結果として上手く書けない事例がいくつも発生しているとされています。

XMLのプロフェッショナルであるはずのW3Cに関与する人間すら、XML Schemaを使えていない現実!

PSVI問題

Post Schema Validation Infoset問題。 同じXML文書でも、XML Schemaを通さなかった場合と、XML Schemaを通した場合でInfosetが変わってきてしまう問題(XML Schemaのデフォルト値の適用)

参考 : 『XMLにおける「ボヘミアンと貴族の階級闘争」を読み解く』を読み解いてみたら例示が欲しくなりました - XML & SOA

特定される単一のスキーマ

XML Schemaは、1つの名前空間に対応するスキーマが1つ存在するという前提を取るアーキテクチャであると言われています。

たしかに1つの文書に複数のスキーマを割り当てたいケースもあるかも。 データと妥当性を分離した、妥当かどうかもContextに依存させるような疎結合なアーキテクチャを実現したいケースもありそう。

貴族とボヘミアンの対立問題

XML Schemaは、全てのXML文書に対応するスキーマが存在し、読み込む際には必ず検証を行うアーキテクチャを前提としていると言われます。つまり、検証しない使用法を全て認めないことを理想としていると考えられます。 ここで注意すべき点は、ボヘミアンの立場がスキーマ不要論ではないことです。スキーマには、使うべき時と、使わない方が良い時がある、という立場です。

現場では、柔軟にXMLを使用したいはず。

W3Cの権威

 世界におけるISOにせよ、日本国内におけるJISにせよ、その権威は本来W3Cより高いものであるにも関わらず、WWWの世界ではW3Cが最も権威を持つかのような錯覚が一部にあって、それが盲目的なXML Schema支持につながっている面があります。

W3Cが論理的で理性的な判断を下せない理由は何か?

Russian Doll と Salami Slice

スキーマ設計とクラス図 | ノート

なるほど。興味深い。

同じことを書くのに、ちょっと自由度があるのがイヤンなかんじもするな。

Profile

Jazz/Fusion Musicを愛するIT技術者です。 現在、Oracle Database 関連の仕事をしています。

保有資格

  • Oracle Master 10g Platinum
  • Oracle Master 11g Gold
  • Oracle Master Expert 10g RAC
  • Oracle Master Expert Oracle on Linux
  • LPIC level2
  • 日商簿記3級

連絡先

ご連絡は、wrcsus4 _at_ gmail _dot_ com にお願いいたします。

 

December 2008
M T W T F S S
« Nov    
1234567
891011121314
15161718192021
22232425262728
293031  

Recent Posts

Recent Comments

Tags

Categories

Pages

Archives

Meta