Z39.50の可能性と問題点


慶應義塾大学文学部

上田修一


(三田図書館・情報学会1996年度研究大会)


1.クライアント・サーバーモデルによるデータベース検索

 今日使われている大多数の商用オンラインデータベース検索サービスでは,大型機(mainframe)に検索システムを搭載し,端末の制御を大型機から行っている。端末が高機能,高性能のパーソナルコンピュータであっても,その性能や機能は処理速度を向上させる以外にはほとんど使われることはない。大型機と端末の間の通信方式は極めて単純なものである。そして,利用者は各々のデータベースサービス毎に異なる検索システム,データベースの構造を意識して探索を行っている。これに対し,クライアント・サーバーモデルによるデータベース検索のための通信規約(protocol)が検討され,米国でZ39.50と呼ばれる規格となった。これは,利用側であるクライアントとデータベースを提供するサーバー側との間に標準的なプロトコルを定めておき,利用者はクライアント側のソフトウェアを使うだけで,個々のサーバーを意識することなく探索を行うことができるようにしたものである。

2.Z39.50の成り立ち

 ANSI/NISO Z39.50-1995 Information Retrieval (Z39.50):Application Service Definition and Protocol Specification は,「クライアントに対する(a)サーバーから提供されるデータベースの探索,(b)探索要求によるデータベース中のレコードの検索,(c)語のリストの通覧,(d)検索結果の並べ替えのための手順と構造を規定し,さらにアクセス制御,資源制御,拡張サービス,それに「援助」機能を規定」(同規格抄録)したものである。ANSI(American National Standard Institute)は米国国家規格を制定している民間団体であり,NISO(National Information Standard Organization)は,情報,ドキュメンテーション,図書館関係の規格制定団体で,米国図書館協会や米国情報学会などの学協会,米国議会図書館などの国立図書館,GEACAT&Tのような企業,OCLCなどのネットワークが投票メンバーとなっている。NISOの制定する国家規格には,分類番号「Z39」が与えられる。従ってZ39.50は,NISOの制定した50番目の規格という意味である。
 表1に示すようにZ39.50は,1979年代末に始まった米国議会図書館と書誌ユーティリティ間の目録情報交換計画であるLinked System Projectに端を発し,検討が進められ,初版は1988年に作成され,何回かの改訂を経て,現在の最新版である1995年版が作られた。

 これとは別に,国際標準化機構(ISO)TC46(情報・ドキュメンテーション専門委員会)のSC4(コンピュータ利用分科委員会)では,1983年からOSI(Open System Interconnection)用のSR(search and Retrieve)と略称される情報検索用プロトコルの審議を続けてきた。これは,1993年にISO10162 Information and documentation-Open System Interconnection-Search and Retrieve Application Service Definition,およびISO10163 Information and documentation-Open System Interconnection-Search and Retrieve Application Protocol Definition として国際規格となった。ところが,本年(1966年),ISO/TC46では,ISO/DIS 23950 Information and documentation - Information retrieval(z39.50)-Application Service definition and protocol specification Fast-Track投票が行われている。通常の国際規格制定過程では,何段階かの投票を繰り返し,制定に至るのであるが,Fast-Track処理では,既存の国家規格が国際規格案(DIS)として投票に付され,賛成が得られれば原則としてそのまま国際規格(IS)となる。すなわち,米国の国内規格であるZ39.50がそのまま国際規格となることがほぼ確実となったわけである。

3.Z39.50による検索

 Z39.50は,表2のような構成を持ち,263ページからなる大部なものであるが,本文は,プロトコルの仕様書であって,独特の表現が用いられており,極めてわかりにくい。

 図1に示すように利用者が使うのは,クライアント側に用意された検索プログラムのインターフェースである。入力された探索要求は,Z39.50クライアント(origin)により,標準的な質問の形式に変換される。質問のタイプは6種類が用意されており,タイプ0は双方がこの規格外で取り決めている場合,タイプ 1は逆ポーランド記法,タイプ2は,ISO8777-1993 Information and Documentation: Command for Interactive Text Searching(対応国内規格はJIS X0803-1995 会話型テキスト探索用コマンド) ,タイプ100は,ANSI Z39.58-1992 Common Command Language for Online Interactive information Retrieval,タイプ101は拡張逆ポーランド記法である。これを,データベース側のZ39.50サーバー(target)が受け取り,検索システムの形式に変換され,データベースの検索が行われる。検索結果は,逆のルートをたどって,利用者に示される。

4.Z39.50の可能性

 ISO-SRZ39.50は,7層からなるOSI参照モデルの最上位にあるアプリケーション層の規格として作られた。しかし,現在のZ39.50TCP/IPを前提としたものになっている。ISO-SRは,Z39.50のサブセットとされ,Z39.50との互換性を保つために修正(amendment)が加えられてきた。それにも限界があることが明らかになり,結局はZ39.50自体が国際規格になるに至った。ISO-SRの実装例は一,二にとどまるが,Z39.50には数多くの実装例がある。いわゆるデファクトスタンダードが国際規格となったわけである。
 Z39.50の開発は,書誌情報,特に目録の書誌情報の検索を目的として始まったが,Z39.50-1995では,さらに画像や遺伝情報など広い範囲を含めようとしているようである。これが可能性の一つである。
 第二の可能性として,クライアント側は、Z39.50を用いることにより、検索の初心者から熟練者までの利用者の習熟レベルに応じた柔軟な利用者インタフェースを装備できるようになると言われている点があげられる。
 また,Z39.50を用いることにより,一つの探索質問を複数のクライアントに同時に送り,検索結果を得る,つまり,インターネットのWAISやあるいはメタサーチエンジンのような操作ができる。OPACの場合には,複数の図書館のサーバーを指定して,同一の文献の所蔵探索を行うことができるため,結果としては総合目録の代替機能を果たすことができるはずである。

5.Z39.50の問題点

 Z39.50は,多文字多言語処理,具体的には日本語処理をはじめとして,技術的な側面ではいくつか問題がある。
 しかし,それ以前にこうした標準がどのような状況で必要であるのかを考えておかなかければならない。1960年代に米国で開発され,現在も広範囲に使い続けられているオンライン文献検索システムには,論理型の検索手法,特有のコマンドの使用などいくつかの特徴がある。利用者とシステムとが「セッション」と呼ばれる状態を構成し,一定時間の接触を保ち続けることもまた大きな特色である。これは,CD−ROMや多くのOPACさらにはWWWで,1回限りの探索で終わってしまう検索システムが広く使われるようになって,かえって際だつことになった特質ということができよう。
 こうした検索状態を保持した検索では,一つの検索行為あるいは検索語に対して検索結果を納めた検索集合(set)が利用者毎に作成され,利用者はこの検索集合を意識し,これらを操作することにより最適な検索結果を得るよう努力する。一方,WWWで使われている検索システムでは,利用者別に検索集合を作ったりはしない。1ページの定まった枠の中に検索質問を表現して探索し,あとは検索結果を眺めていくか,前ページに戻って修正して検索し直すという行為を繰り返して目的を達する。
 現在,Z39.50を使おうとしているのは,大学図書館が中心であり,その目的はOPACの学外への公開である。OPACの利用を考えてみると,比較的,単純な探索が大多数を占めると予想される。これは,現状のWWWによる探索で問題なくカバーできるはずであり,すでにWWWのブラウザーも行き渡っている。複雑な検索は,専門的な分野の限られたデータベースを対象に商用サービスで行われているが,これらを一般の利用者が「たやすく」利用できるようにするために膨大な努力を払う必要があるのだろうか。つまり,これまでの「セッション」を中心とした情報検索のプロセスは,情報検索にとって本質的なものであって,これを守り抜かねばならないのかといった疑問が生じるのである。


 本稿の作成にあたり,図書館情報大学大学院生の安齋宏幸氏のWebページ(http://WWW-student.ulis.ac.jp/~anzai/z39.50.html)に多大の示唆を得た。同ページは,Z39.50の網羅的なリンクページであるInternet Searching with Z39.50http://pages.prodigy.com/ZUPN84A/z3950.htm)にも唯一の日本のZ39.50関連サイトとして掲載されている。他にリンクページとしては,A pointer page about Z39.50 Resourceshttp://ds.internic.net/z3950/z3950.html)などがある。なお,Z39.50-1995の全文は,米国議会図書館のZ39.0のページの中の文書ページ(http://www.loc.gov/z3950/agency/1995doc.html)に,ASCIIPDFなど4形式で収録されている。冊子体はNISOから入手できる(ISBN 1-880124-26-2 $79)

ホームページへ