Welcome to SHOWA!!
ホーム
「技術トピックス」目次


文書構造化言語の現状
急速に進むXMLのサポート

SHOWA NEWS No.88
2000年3月22日号より

SGML/XMLをめぐる動きがスピードを増しています。
第1は、官公庁や企業における文書電子化の流れ。
第2は、メーカーやソフトハウスなど、ベンダー側のシステム開発や技術サポートの強化。
第3は、情報処理業界、印刷業界など、受注側における関心の高まり。
以下、最近の動きをそれぞれの分野について、ざっとご紹介します。

SGML/XML/HTML
はじめにSGMLやXMLの流れを簡単に振り返っておくと、SGML(Standard Generalized Markup Language)は文書の構造を記述する言語で、1986年にISOが制定し、米国防総省が採用したこともあって、製造業の仕様書やマニュアルなどに利用が広がりました。日本でもこの10年ほど少しずつ対応が進んできました。難点は、あまりにも大規模な言語であるため、習得に時間がかかり、対応システムの開発も容易でないことなどがあります。

SGMLの応用例に、インターネットのホームページ作りに使われるHTML(Hypertext Markup Language)があり、習得が楽なことや専用エディターも多種のものが出回って、すでにユーザーは世界で数百万人に達していると見られます。ただしHTMLは、文書の構造を記述する機能は皆無に近く、レイアウト指定の手段として使われています。

大規模すぎて取り組みが容易でないSGML、簡易ではあるが記述能力の低いHTML、このギャップを埋めるものとして登場したのが、98年にW3C(World Wide Web Consortium)から最終勧告の出たXML(eXtended Markup Language)です。
XMLは、(1)SGMLに匹敵する強力な文書構造記述能力を備えていること、(2)SGMLより格段に小規模で(SGMLの規約書が500ページに達するのに対し、XMLは50ページ)、システムの管理者や開発者の負担が軽いこと、(3)SGMLより厳格な文書作りが要求されるため、かえって対応ソフトウェアなどの開発が楽であること、(4)SGMLの制定時には考慮されていなかったインターネットに対応していること、などの長所があり、これからの文書構造化に広く用いられる可能性が大です。XMLについては、記事末に参考資料をあげておくので、ご参照ください。

動き出した官公庁
日本の官公庁でも数年前からSGML化の掛声が強まり、一部の省庁や有志のあいだでは取り組みや研究が進みました。また、2002年、2003年を目標とする文書デジタル化や行政窓口のオンライン化のスケジュールも動き出し、今後数年で急速にSGML/XML化が進むと見られます。
さらに昨年は、景気浮揚策の一環ということもあって事業が前倒しされ、秋口からかなりの件数・ボリュームの発注があったようです。W3Cで正式決定されたXMLが、SGMLと並んで多く採用されているのが今次の特色です。
ただし、問題はまだまだ多く、発注側もSGML/XMLを十分理解しているとは必ずしもいえません。中には、何を求めているのか理解しにくい、意味不明に近い発注仕様を提示されるケースもあったようです。文書構造化・文書電子化の意義が、まだ浸透していない現われでしょう。

中央省庁のうちでは、大蔵省などの取り組みが進んでいるようです。発注仕様もよく整理されているとのことで、注文内容が厳格なだけに、やりやすい仕事でもあるようです。
製薬関係のSGML化は、高度なレベルに達しています。統一フォーマット(文書形式)もすでに固まり、業界を管轄する厚生省をはじめ、各製薬会社、また文書の印刷を担当する印刷会社まで、かなり理解が進んでいます。多くの場合、実際にSGML化を手がけるのは印刷会社ですから、SGMLに対応できないと、今後この方面の仕事の受注は難しくなります。

注目したい地方の動き
官公庁のSGML/XML案件で押さえておきたい点が二つあります。
ひとつは、この先しばらくの案件は、過去の文書の電子化が中心になるだろうということです。この種の仕事は1件当たりのボリュームが大きく、昨年の実績を見ても、印刷物にして数千ページから数万ページのものが中心で、大は10万ページに及ぶものがありました。
これらの仕事が山を越えると、次の段階では日常のルーチンワークが中心になります。ただしルーチンワークといっても、単純なタグ付け作業は単価が小さく、利益も薄く、企業を潤すものとはなりません。過去の文書の電子化業務も同様ですが、多くはSGML/XML文書を軸にした情報処理システムの立ち上げ・管理・運営といった業務とセットで発注されます。社内の人材育成や協力会社との連携を深めるなどの準備が求められます。

もうひとつのポイントは、地方自治体への波及です。政府も、地方における文書電子化・構造化を支援する構えですが、中央省庁でもスムーズには進まない電子化・構造化が、地方でいっせいに実現するかは、かなり疑問です。上からの働きかけよりも、むしろ、見識のある印刷会社やソフトハウスなど下からの働きかけによって、ばらばらな形で(格差をともなって)地方の文書処理・情報処理の電子化が進むのではないでしょうか。
地方自治体でのSGML/XMLの採用が進むと、この二つの言語とくにXMLが日本の文書処理のベースになります。この間には、一部のコンピュータ関連産業や輸出産業でさらにSGML/XML化が進むでしょうし、国内向けの製造業や流通業の一部でも文書の構造化が進んでいるはずです。地方自治体の動きは、SGML/XML化進展の目安として、しばらく目が離せません。

広がるサポート
今年2月のPage2000では、SGML/XML関連のシステムが幾つか目につきました。
ショーワ・ミニ展でもご覧いただいた大日本スクリーン製造の組版システムAVANAS BookStudioもそのひとつです。このシステムには、BookStudioデータとSGML/XML文書との双方向の変換ソフトがオプションで用意されており、印刷物とSGML/XMLデータベースとの連携・一貫処理が可能となります。

トータルメディア研究所は、ソフトハウスと提携してSGML/XML支援ツールを出品しました。オフィスなどで広く使われているMS Wordデータとの相互変換が可能です。

富士電機総設は、XML文書の変換ソフトを各種出品しました。
同社のXML/Assistは、MS-Wordなどで作成したRTF(リッチテキスト形式)文書とXML文書の双方向コンバーターです。RTFまたはXMLを変換元として、XML、RTF、HTML、CSS、XSLを出力します。CSS、XSLは、マークアップ言語のためのスタイル(レイアウト)情報ファイルで、W3Cが規約を定めています。
同じく富士電機総設の「らくらくDBホームページの鉄人」と「らくらくDBホームページの鉄人II」は、それぞれMS AccessとMS ExcelのデータをXMLに変換するソフトです。HTMLでは事実上不可能なデータベースとウェブページの連携を可能にします。

組版ソフトWAVEを持つシンプル・プロダクツは、XML処理ツールを搭載したWAVE III 2000を出品しました。XML文書を組版データに展開したり、組版データをXMLに変換することができます。一部機能は、上のXML/Assistと連携して実現されています。

クォークジャパンは、QuarkXPressのデータをXML文書に変換するavenue.quarkというソフトを出品しました。来場者の人気の高かったブースです。
このほか、ソフトハウスや印刷会社からSGML/XML対応システムが提案されていました。

XMLにシフト?
このようにSGML/XML関連システムが多く登場してきた中で、印刷業として検討すべきことは、SGML/XMLについてどんなレベルで研究・学習・訓練に取り組むかということです。ツールが増えてきたということは、それだけ処理が楽になるということを意味します。SGMLの知識が皆無でも、組版が終ればSGMLデータが自動生成されるのであれば、オペレーターレベルの教育は、考えられていたよりも格段に軽くなります。求められているのは少数精鋭の人材かもしれません。その場合、自社の部署や人員をあてるほかに、協力会社との提携や同業との共同運営による別組織の設置などの対応も考えられます。

情報処理業界、印刷業界など、受注側の対応も、SGML/XMLの成否を左右する大きなファクターです。いくら案件が発生しても、だれもそれを処理する力がなければ成果に結び付かないわけで、見方によっては、文書構造化の成否は受注側にかかっているともいえます。
その受注側の動きで、興味深いことがあります。2月末に日本電気オフィスシステムで恒例の小展示会があり、そのさい「電子政府における文書処理」と題して日本電気の官庁担当者によるセミナーがありました。興味深いのは、担当者が「XML+Java」という基本方針を掲げていたことです。つまり、文書の交換手段としてはXMLを採用し、そのためのシステム構築・運営にはJavaを利用するということです。JavaはインターネットやXMLとの親和性の高い言語ですので、この選択は現時点で合理的なものと思われますが、それよりも、SGMLのサポートに経験とノウハウを持つ日本電気が、SGMLに言及せずXMLだけをあげたことに興味を引かれます。あるいは、これまでのSGML資産についてはサポートを続けるが、今後の文書処理はXMLに絞りたいということかもしれません。

XML参考書
最後に参考書を幾つかあげておきます。SGMLについては、この3〜4年、めぼしい参考書は出ていません。以下はすべてXML関連です。

入門書としてお勧めできるものに、富士通XML推進チームによる『はじめてのXML』(97年、日経BP社)があります。HTMLのごく初歩的な知識か、トータル組版システムN5170などのタグ付け方式に触れた経験があれば、容易に理解できます。はじめの50〜60ページも読めば、XML文書と文書構造化について、おおざっぱな理解は得られるでしょう。XMLの最終勧告が出るまえの規格に従っているので、実務に使うには注意が必要です。
実務者向けの良書に、日本ユニテックXML/SGMLサロン『標準XML完全解説』(98年、技術評論社)があります。現状では、XMLの解説書は多くが翻訳書であり、ほとんど日本語環境への言及がありませんが、その点でも『標準XML完全解説』は勧められます。同書は、98年のXML最終勧告に基づいて書かれています。
雑誌『オープンデザイン』(12月号、2月号、CQ出版社)の連載記事「つくりながら学ぶXML」は、初歩的な解説が少ないのが難点ですが、手軽に入手できるXML対応ブラウザー(インターネットエクスプローラ5.0など)を利用する実践的な記事です。
大冊ですが『XML実践ガイド』上・下(99年、アスキー)は、XMLを取り巻く環境を含めて幅広い知識の得られる好書です。アスキーからは最近続けてXML関連書が出されています。
そのほかプログラマー向けの書籍や雑誌記事が急増中で、XMLをめぐる動きの拡大を感じさせます。

Mail to SHOWA