PAGE TOP

取り組み

印刷する

DITAというマニュアルの構造化

さぼ郎
構造化文書というとSGMLを想い出します。SGML(Standard Generalized Markup Language)の略だそうで、ようは構造化した文書を意味するテキストデータで、マークアップというタグで意味付けをしたものです。

SGML

アメリカでは軍事という産業があって、その産業を中心にSGMLの活用度があったようです。

というのは、A社が一太郎でB社がワードの2003でC社がインデザインで などとなると戦争になりません。

また、印刷して紙のマニュアルにするとしても、戦車の中に何千ページものマニュアルを積んで置くわけにもいきませんし、実用的でもありません。軍艦など、何万ページにもなりそうなマニュアルに火がついても萌えますし、水が滲みれば重そうです。

というわけで、電子化する必要性があって、また、いろいろな産業や企業が参入して戦闘機や軍艦を作っているわけですので、統一した規格が不可欠になるわけです。

そこで考えだされたのが「SGML」だったのですが、相当頭の良い人達が考案したものと見えて、2回、全文を見ないと確定できないような使用になっている部分があったり、レイアウト(つまり出力)をどうするかという問題がありました。

となると、必要は発明の母で、その辺を克服したレイアウトソフトが登場してきます。それは「FrameMaker+SGML」というレイアウトソフトでした。

framemaker

SGMLはタグ付きのテキストデータなのですが、業界とか、あるいは軍隊とか寄せ集めてシームレスに使用する「元締め」があるとするなら、規則なしには構成することが出来ません。

そこで不可欠なのがDTD(Document Type Definition)になります。約束に対して書式をつければレイアウト情報になりますね。それが FrameMakerにとってのEDD(Element Definition Document)です。

DTD

SGMLによる文化は欧米では極く、普通に定着したようですが、日本ではめざましく浸透したという話は耳にしません。

その理由は、「綺麗なレイアウトへの要望が高いから?」「物事を構造的に考えるのが苦手だから?」

その両方とも理由としては存在すると思いますが、規格が学術的というか、専門的すぎというか、変な言い方をあえてするなら「宗教」じみていることに起因すると思います。

この宗教じみた規格を作っているのがW3C(World Wide Web Consortium)という機関です。ここで規格と称する「経典」を作っています。

w3c

家を建てるのに構造が不可欠で、そのために設計があります。これはよく分かるのですが、住む人の家に対する利便性よりも構造の純粋性が優先するような、いわば、唯我独尊のような印象を個人的には感じています。

構造化文書を全否定するつもりは毛頭ありませんが、一字一句までをがんじがらめの構造化文書で作成するとなると、文書を作る時間よりも、構造に適合させ、その構造の正当性からレイアウトに展開させることにかけるコストも莫大になります。

アメリカには軍需があるから元は取れますが、日本では憲法改正を待たなければなりません。

SGMLも1パスで構文チェックが出来なかった反省から改良されたのがXML(Extensible Markup Language)という規格です。

xml

XMLは、タグでくくることに矛盾がなければ、結構イージーに使うことが出来ますが、これとても、業界なり軍隊なりで集約して多くの参入企業が使うとするならルールは不可欠で、その構文チェック(DTD)が必要になります。

XMLをダブルクリックしても構文がブラウザに表示されるだけで、レイアウトに展開されません。それを展開するためには、XSLExtensible Stylesheet Language Transformations)というような出力用の翻訳ツールをと使わないとXMLのタグと対応させて書式を付けることが出来ません。

xsl

さらに、昨今のブラウザ対応としてはcssも組み合わせなければ「リフロー」と称する表示もできません。

css

そこで登場してきたのがマニュアルに特化したという触れ込みのDITADarwin Information Typing Architecture)になりますが、これも、確かに完全なDITAに移行すれば、便利になるのかもしれませんが、構造化文書の純粋な世界を作るために製品を製造し、マニュアルを作っているわけでもないので、非構造化文書も包括できる解決策が求められるような気がします。

dita

と、こうしてみると、ひたすらアメリカからくる文献を翻訳しているだけで、日本語文化の独自性は全くありません。

日本語化が全くできていない技術文化が、そもそも定着するはずなどなく、思想から細かな技術まで、100%がメイド・イン・アメリカで文書文化が構成されるなら、幕末・明治早々に始まる外来思想の日本語化(つまり咀嚼・摂取・定着そして発展)という先人たちの努力への冒涜であるような気がしてしまいます。

キーワード