第3章 情報と資料の種類


3.1 図書館資料の種類

3.2 情報と情報メディア

3.3 一次資料の種類

3.4 二次資料の種類

3.5 情報メディアの物理的な形態

3.6 第3章のまとめ

3.7 練習問題

→全体の目次へ戻る

本章では、第2章で紹介した図書館において、実際にどのよう な情報や資料を利用できるかについて説明する。

3.1 図書館資料の種類

[1]まず、図書館で所蔵されている資料は、大きく2つに分けら れる。それは、

である。図書館情報学(library and information science) の世界では、前者の「読む本」は一次資料と呼ばれ、 後者の「調べるための本」は二次資料と呼ばれている (厳密な定義については図書館情報学の教科書を参照)。ただし、 「一次資料」「二次資料」という用語は他の分野(たとえば歴史学 など)では異なった意味で使われることがあるので注意を要する。

[2]具体的に「読む本」とは、文字どおり、みなさん が普通に読んでいる本、たとえば小説や専門書などを指す。一方、 「調べるための本」の代表例は辞書である。たとえば、辞書を 推理小説のようにはじめのページから丹念に読むということは ふつうしない(まれにそうする人もいるようだが)。通常は、 何かことばの意味がわからなかったり、漢字の表記がわからな かったりしたときに、それに関する部分だけを探して読む。辞 書はこの意味で普通の本とは異なるので、「調べるための本」 の範疇に入れられる。「読む本」と「調べるための本」の境界 は時にははっきりしない場合もあるが、以上の例でおおよその 違いは理解できたことであろう。

[3]また「読む本」に近いものとして、雑誌や新聞など がある。図書館では、貸出可能な図書と雑誌と新聞は、通常、 分けて置かれているが、「調べるための本」との対比で考えると、 これらは「普通に読む」という点で、同じ性質を持った資料 のグループである。

[4]一方「調べるための本」は図書館ではしばしば参考図書 (レファレンス・ブック)と呼ばれる。 この語は、みなさんが中学や高校で使った「参考書 」とよく似ているが、基本的にはまったく異なるものである。多くの 図書館では、特に参考図書のコーナーが設けられ、普通に貸出 のできる本とは別の場所に置かれている。

[5]「調べるための本」(すなわち二次資料)はさらに次の2種類に分けられる。

前者はすでにおおよそ説明済みである。後者については「目録」 をすでに第2章で説明した。「書誌」は耳慣れない語だと思うが、 これについては、3.4節で詳しく説明する。

[6]以上のさまざまな資料(図書館資料)を列挙する と、次のようになる。

  1. 一次資料

  2. 二次資料

この中にはまだ説明していないものも多いが、それらについては、 3.3および3.4で解説する。

第3章の先頭に戻る


3.2 情報と情報メディア

[1]図書館資料の詳しい説明に入る前に、まず、「情報」と「情報メ ディア」ということばについて考えてみてほしい。みなさんは、 情報(information)という語から何を連想するだろうか。一昔前ならば、 たとえば米国の「中央情報局(CIA)」などを思い出す人が多 かったであろうが、最近では多くの人が「コンピュータ」を連 想するだろう。実際には、かなり多様な意味で「情報」という ことばが用いられている。遺伝情報、情報化社会、就職情報、 情報ネットワーク、医療情報、ブライダル情報など、その用い られかたは多種多様である。

[2]それでは「情報」とは実際には何であろうか。これには多 くの意見や考え方があり、ひとくちに説明するのはなかなかむ ずかしい。けれども、情報にはひとつの大きな特徴があること は確実である。それは情報は常に情報メディア(information media) によって伝達さ れることである。「メディア」とは「媒体」とか「媒介」など と訳されることもある。

[3]「ある場所で大きな洪水が起こった」という架空の 例を考えてみよう。この情報をわれわれにまずはじめにもたら すのは、おそらく、テレビのニュース 速報であろう。また、ラジオは番組を中断して、そのニュース を流すかもしれない。その後、新聞の翌日の朝刊(あるいは当 日の夕刊)にそのニュースが大々的に取り上げられるだろう。 テレビでも報道特番が組まれるかもしれない。いずれにしても、 「洪水発生」という情報は、テレビや新聞などのさまざ まな情報メディアを通して伝達されることになる。

[4]すなわち、情報は情報メディアに「乗せられて」運搬され、 われわれのもとに届く(図3.1参照)。このとき、情報の仲介者 があいだに入ることもある。

図3.1 情報と情報メディア

[5]「洪水発生」の情報は、後日、雑誌記事などに載り、 さらに、それに関する単行本が出されるかもしれない。ここで、 注意すべきことは、それぞれの情報メディアは独自の特性を 持っているという点である。テレビのニュース速報というのは、 その情報が発生してから(この場合は事件が起ってから)、視 聴者に伝達されるまでの時間がきわめて短い。その反面、ごく 少量の情報しか伝わらない。それに対して、新聞やテレビの ニュース番組は、速報よりも伝達までの時間がかかる反面、情 報は豊富になる。さらに、雑誌は週刊や月刊などの間隔でしか 発行されないから、新聞よりも伝達までの時間が余計にかかる が、そのぶん、分析や論評などが加えられる。

[6]このように、

という性質を情報は持っている。われわれが情報を捉えようと する場合、どの情報メディアに乗った情報が適切であるかを 考慮する必要がある。

[7]なお、われわれのもっとの身近な場所で 情報を伝達するのは、新聞やテレビなどのいわゆるマスメディア なので、「メディア」という語が、新聞社やテレビ会社 などの組織やそこで働く人を含めたマスメディアを意味する こともある。しかし、このテキストで問題とする「情報メディア」 の中心は、前節で説明した図書館資料である。マスメディアに ついて勉強したい人は別の授業で学んでもらいたい。

[8]また、情報に関する重要な区分けとして、

の区別も重要である。これらについても、時には、その境界が あいまいになることも多いが、基本的な区別は必要である。 このテキストでは後者について中心的に解説する。

図3.2 一般的な情報の流れ

第3章の先頭に戻る


3.3 一次資料の種類

3.3.1 単行書

3.3.2 雑誌記事・雑誌論文・新聞記事

3.3.3 会議資料

3.3.4 学位論文

3.3.5 報告書

3.3.6 灰色文献

[1]前節で洪水の例によって説明したのは、ニュース などの一般的な情報の流れであった。これを図3.2にまとめてお く。これらのうち、テレビやラジオは一 般には図書館では扱われないが、それを録音・録画したものに ついては、録音テープまたはビデオという別の形態の情報メディアとして、 収集・保存・提供される場合もある。

[2]一方、学術的な情報(以下、単に学術情報と呼ぶ)の場合 は、図3.2とは少し異なる。それを図3.3に示す。

図3.3 典型的な学術情報の流れ

もちろん、すべての学術情報がこのように流れていくわけでは ない。場合によっては、研究成果を直接、単行書として刊行す ることもある。また、世の中に対して影響力の大きい研究成果 は、一般的なニュースとして報道される場合もある。以下、図 3.2と図3.3中に示された資料を中心にして説明していく。

3.3.1 単行書

[3]単行書(monograph)は単に図書 (book)と呼ばれることも多い(実は「図 書」の方がより広い概念である)。図3.2、図3.3の両方において、 流れの末端付近に位置していることからわかるように、単行書 は、さまざまな情報が最終的にまとめられて刊行されるための 情報メディアとしての役割を担っている。この傾向は学術情報 において強い(この場合「学術図書学術書」と呼ばれること もある)。実際、雑誌論文などに公表された研究成果がいくつ かまとめられて、単行書として出版されることがよくある。こ の場合、もともとの研究成果はすでに雑誌論文として発表され ているという意味で、単行書のオリジナリティ(独創性)は低い。し かし、人文・社会科学系では、雑誌論文を経由せずに、単行書 によってオリジナルな研究成果が直接発表されることも多い (一部の自然科学においてもこのことはあてはまる)。

3.3の先頭に戻る


3.3.2 雑誌記事・雑誌論文・新聞記事

[4]雑誌論文(paper、article)は特に自 然科学において重要視され、その研究成 果は主として、学会での報告を経たのちに、学術雑誌 の掲載論 文として発表される。学術雑誌には、学会が発行するものと (たとえば『情報処理学会論文誌』)、出版社が発行するもの と(たとえば岩波書店の『数学』)、大学などの研究機関が発 行するものとがある(これは特に紀要と呼ばれる)。

[5]このうち主として学会が発行するもの(すなわち「学会 誌」)には、査読制(レフリー制)が取り入れられ、論文 の質が同じ分野の研究者によってチェックされていることが多 い(すなわち、質の低い論文は掲載されない)。すると、当然、 このような学術雑誌に何編論文を書いたかという観点から、研 究者の業績を評価できることになる。この意味でも、学術雑誌 は研究者にとって重要である。

[6]また、新聞記事も重要な一次資料である。新聞記事は、社 会的な事象や事件を調査・分析しようとする場合に、非常に有 用な材料となる

3.3の先頭に戻る


3.3.3 会議資料

[7]研究成果は、雑誌論文や単行書のかたちで正式に刊行され る前に、まず、学会で報告される場合が多い。したがって、そ の際に配布される予稿集や、学会が終了したのちに刊行される 会議録は重要である。予稿はプレプリント(preprint)とも呼ばれる。 これらを総称して、会議資料(proceedings)という。ただし、予稿集や会 議録は常に刊行されるとは限らない。

3.3の先頭に戻る


3.3.4 学位論文

[8]学位論文(dissertation、thesis)は 一般に、博士号を取得するために提出する論文 である博士論文を指す。博士論文には、博士号を取るため の独創的で優れた研究成果が盛り込まれている他に、通常、そ れに関連する研究領域についての文献展望レビュー、review) が付さ れており、重要な情報源となる。なお、一般には学士・修士・ 博士を総称して「学位」というのであるから、卒業論文や修士 論文に対して「学位論文」という語が用いられることもある。

3.3の先頭に戻る


3.3.5 報告書

[9]数多くの研究機関や企業・官公庁によってさまざま な\textgt{報告書}が刊行されている。その形態は、単行書の かたちをとり正式に出版されるものや、簡易製本によって非公式 に出されるものなど、多種多様である。

[10]その中でも、1つの確立した資料のカテゴリーとして、 テクニカル・レポート(technical report)がある。 これは、主として研究・開発(R&D) 活動から生まれた技術情報についての報告書であり、米国を中 心に普及している。その起源は、20世紀初頭のイギリスと言わ れているが、第2次世界大戦の軍事関係の研究・開発成果の伝達 手段として用いられたことを契機として、重要視されるように なった。米国のPBレポートやINISレポートなどが有名であるが、 日本でも原子力研究所や文部省高エネルギー 研究所などがテクニカル・レポートを出して いる。

技術情報以外に、頻繁に利用され、情報価値の高い報告書としては「政府刊行物(地方自治体等の刊行物を含み、官公庁刊行物とも言う)」がある。この種の報告書類は、その後の政策・規制や法令などとも関連して、情報価値や信頼度が高く、関係者にとっては見逃せない情報源となる。しかし、しばしば、その配布される範囲が限定されたり、その報告書の存在そのものが公表されなかったりすることもあり、後述の「灰色文献」となるものも多い。

3.3の先頭に戻る


3.3.6 灰色文献

[11]灰色文献グレイリテラチャー) とは、特定の情報メディ アの名前ではなく、入手しにくい資料やその存在が一般には知 られにくい資料の総称である。たとえば、すでに説明したプレ プリント(予稿)や、一部の官公庁刊行物などがその代表例である。予稿集は当日、その学 会に参加しないともらえない場合が多い。なお、プレプリント は、学会での予稿でなく、研究者が自分の研究成果をよりはや く研究仲間に知らせるために、簡単にその内容を書いて非公式 に配布したものを指す場合もある。自然科学の最先端分野など で、このようなプレプリントは用いられているが、それらが一 般の流通ルートに乗ることはほとんどなく、一般の人々にとっ ては灰色文献となる。

[12]また、すでに説明したテクニカル・レポートをはじめとす るさまざまな報告書類(各研究機関や企業などが出すもの)も 入手しにくく、灰色文献となる場合が多い。ただし、 最近はインターネットの発達により、灰色文献がインターネット経由で 入手できることも多く、このような状況は一部 改善されつつある。

第3章の先頭に戻る


3.4 二次資料の種類

3.4.1 書誌

3.4.2 目録

3.4.3 索引

3.4.4 抄録誌

[1]次に、二次資料の種類について説明する。二次資料が「事 実解説的なもの」と「どのような資料があるかを調べるもの」との2つに分けるこ とができるということは3.1ですでに説明した。このうち、 前者はすでにみなさんにとってなじみのものが多い。たとえ ば、「辞書」については、国語辞典や漢和辞典にはすでにかな りお世話になっていることだろう。また、「百科事典」、「年 表」、「年鑑」、「地図帳」などもどこかで一度はお目にか かっているのではないだろうか。3.1で説明した事実解説的な二次資 料の中で比較的なじみのうすいものは「便覧」かもしれないが、 これは最近の言い方では「ハンドブック」である。「○○ハン ドブック」の類の本はおそらく1度は利用したことがあるだろう。

[2]というわけで、ここでは事実解説的な二次資料に関しては 特に説明しない。第6章「事実情報の検索法」におい て、これらの資料はフルに活用されることになるから、事実解 説的な二次資料の具体的な説明は第6章でおこなうことにする。

[3]一方、書誌や目録を使った経験がある人は 少ないであろう。そこで、ここではこれらにつ いて、簡単な説明を与えておく。なお、書誌や目録は第5章 「文献の検索法」で用いられるから、事実解説的な二 次資料と同様に、具体的な説明は第5章のほ うでおこなうことにする。

[た]

高木 友広.民俗学の周辺.東京, 英花房, 1966, 335p.

高橋 光一.日本民衆史.東京,千代田書房, 1975, 445p.

高橋 博史.古事記考.東京, 大日本出版協会, 1976, 228p.

高橋 義行.日本における律令制の研究.東京, 千代田書房, 1980, 501p.

竹中 務. 注釈今昔物語(1). 東京, 岩橋出版, 1979, 354p.

竹中 務. 注釈今昔物語(2). 東京, 岩橋出版, 1982, 376p.

田坂 由美ほか. 江戸風俗百科事典. 東京, 万華堂, 1979, 1102p.

田島 一郎. 古墳時代の祭祀について. 東京, 東海書房, 1977, 221p.

図3.4 書誌の記述の例

3.4.1書誌

[4]書誌(bibliography)とは、簡単に言えば、 「文献のリスト」である。ただ し、文献といっても、特に「図書」のリストを書誌という場合 が多い。それに対して、雑誌記事あるいは雑誌論文のリストは 索引と呼ばれることが多い。書誌の例を図3.4に示す。ただ し、この図3.4は書誌の中に書かれている記述 (description)の例である。書誌自体の体裁・外見は本と 代わらない(多少大き目のことが多いが)。すなわち、書誌とは、 すでに述べたよう に「文献のリスト」であり、図3.4のような「記述」が掲載され ている一種の本なのである。

この図の書誌では、各図書が著者名順に並べられており、そ れに続いて、書名、出版地、出版者、出版年、ページ数が記述 されている。これらを書誌事項と呼ぶということはすでに説明 した。すなわち、書誌にはこのように各図書の書誌事項が列挙 されているのである。

3.4の先頭に戻る


3.4.2目録

[5]目録(catalog)については、すでに 第2章において図書館目録あるいは蔵書目録を紹介してある。 これらは、冊子体目録のよ うに、通常の資料の形態を取っていれば、ここで説明する二次 資料としての目録に含まれる。

[6]その他に「文献目録」がある。これは書誌とほとんど同じも のであるが、「書誌」という語は「図書」のリストに対して限定して使 われる傾向があるので、たとえば、図書と雑誌論文が混在したリスト には「文献目録」という語が使われることがある。また、雑誌のリストに対しては 「雑誌目録」というような言い方がなされる。あるいは、図書の場 合でも、図書のリストであることを明確にしたいとき、「図書 書誌」とは習慣的に言わないので、「図書目録」のように表現 される。各文献の記述の方法やそれらの配列の方法に関しては、 書誌と原理的には変わらない。

3.4の先頭に戻る


3.4.2索引

[7]すでに述べたように、雑誌記事や雑誌論文のリストを 索引(index)と称することが多い。「索引」という語から、本の最後の ほうにつけられている巻末索引を連想する人が多いであろ う。これは、本文中に出現した用語がどこに出現したかを指し 示すものであり、読者は、その用語を手がかりとして望みの ページへ「ジャンプ」できる(第4章も参照)。「索引」とは本来このような機 能を表す概念である。雑誌記事や雑誌論文のリストである「索 引」もよく考えればそのような機能を持っているといえなくも ないが、ここではとりあえず、「巻末索引」と、文献リストと しての「索引」とを分けて考えておいたほうが混乱しなくて済 むであろう(実際の場面では、それで十分である)。索引にお ける記述の例を図3.5に示す。

統計学

赤坂信夫.ベイズ統計学の理論. 理論統計学,10(3),225-245(1982)

金井眞木男. 系列相関と回帰分析. 統計学研究,24(10),678-692(1982)

木村信之. 因子分析における区間推定. 多変量解析研究,5(1),1-10(1983)

児島栄一. ジャックナイフ検定の応用. 統計,45(5),223-256 (1982)

坂井和弘.正準相関分析のアルゴリズム. 理論統計学,10(1),15-20 (1982)

佐治光彦.逆ガウス型分布に関する漸近理論. 理論統計学,10(1),1-14(1982)

図3.5 索引における記述の例(雑誌論文のリスト)

すでに述べたように、図3.4と同様に、図3.5も一種の文献リスト であるが、図3.4が図書のリストであるのに対して、図3.5は雑誌 論文のリストである(索引もまた、その体裁・外見は本のかたち をとる)。したがって、その書誌事項が異なって いる。雑誌論文の場合の典型的な書誌事項は以下のようなもので ある。

すなわち、図3.5の例では、上の書誌事項が図3.6のように対応し ている。

図3.6 雑誌論文の記述の例(和文と欧文)

[8]雑誌の「号(number)」はみなさんよく知っていると思うが、 「巻(volume)」にはそれほどなじみがないのではないだろうか。雑誌とは 本来、同一タイトルで継続的に出される出版物であるが(この 定義は実はあまり厳密でない)、通常、「巻」はそれらを1 年分まとめたときの単位である。たとえば、ある雑誌が月刊で 1990年の1月に創刊されたならば、1994年の10月号は「第4巻第 10号」となる。そして、1995年に出版される分は「第5巻」と なる。図3.6の記述法に従うと、「第4巻第10号」は「4(10)」と 書ける。

[9]しかし、この雑誌論文の書誌事項の記述のしかたにはさま ざな方法があって、必ずしも「4(10)」と書くわけではない。 たとえば、「Vol.4,No.10」などと書くこともある。その他、著 者名、標題(論文名)、掲載雑誌名、出版年などに関しても、さまざ まな記述法がある(多くの記述法がある点は図書も同様である)。

日本語テキストのための自動索引システムの開発
An Automatic Indexing System for Japanese-Language Text

福澤太郎
Taro Bunka

慶應義塾大学 文学部
Faculty of Cultural Information Resources, Surugadai University

Abstract

標準的な日本語テキストから索引語を自動的に抽出するシステムを開発し た。システムは2つの部分から成り立っており、それは、1)構文解析部、2)索 引語抽出部である。まず、日本語の論文の標題および抄録が構文解析部へと 送られ、標準的な構文解析法によって名詞が抽出される。この際、各名詞は 複合名詞として解析され、それらの複合語の構成要素のうち、意味のあるも のだけが次の索引語抽出部へと送られる。索引語抽出部では、それらはシ ソーラスと照合され、統制語彙として採用されるものだけが残される。実際 に、このシステムに150件の電気工学関連の論文の日本語抄録を入力したと ころ、1論文あたり10.4語の索引語が抽出された。シソーラスとしては、 JICSTのシソーラスを独自に拡張したものを用いた。

1. はじめに

効果的な文献検索を実現するためには、索引語(ディスクリ プタ)が必要不可欠である。この索引語の付与をコンピュータ に自動的に行わせようという試みが、1960年代から数多く行われている。...

図3.7 抄録の例(論文の冒頭の一部)

3.4の先頭に戻る


3.4.4抄録誌

[10]雑誌論文には、抄録(abstract)が付けられていることが 多い(特に自然科学系ではその傾向が強い)。抄録とは、その 文献の内容を短く要約したものである。その例を図3.7に示す。 抄録誌は、図3.6のような著者名・タイトル・掲載雑誌等に加え て、このような抄録も一緒に掲載したリストである。したがっ て、索引よりも、抄録誌のほうが各論文の内容をより詳しく知 ることができる。このような抄録を論文に付ける習慣はどちら かといえば自然科学の分野に普及していたため、自然科学分野 では有名な抄録誌が数多く存在する(たとえば、Chemical Abstractsなど)。

第3章の先頭に戻る


3.5 情報メディアの物理的な形態

[1]以上、さまざまな図書館資料の種類を紹介してきたが、こ れらの種類はどちらかといえば、機能的な区分によるものであ る。この他に、図書館資料を物理的な形態で区分することもあ る。たとえば、新聞は、現物あるいは縮刷版のような「紙」の 形態で図書館に保存される場合と、マイクロフッシュようなマ イクロ資料の形態で保存される場合、さらに、最近ではCD- ROMのようなコンピュータで扱う媒体に記録されて保存さ れる場合とがある。いずれも、記録される内容は変わらないの であるが、その物理的形態に著しい差がある。

[2]マイクロ資料は、資料をそのまま肉眼では文字を判別でき ないほどに小さくして、写真として記録したものである。非常 に大量の資料がコンパクトになる点で保存スペースの節約にな る反面、実際に読むには拡大装置(マイクロ・リーダー)が必 要になるという短所があるので、主として、新聞 や設計図などのかさばる資料や、古くなって紙の破損がひどい 資料などに対してマイクロ化が利用されることが多い。

[3]また、ビデオやテープなどの視聴覚資料(AV資料)は重 要な図書館資料である。特に最近では、CD(コンパクトディス ク)やLD(レーザーディスク)に音や映像の資料がデジタル化 され、記録されることも多くなっている。また、マルチメディ ア技術の進展によって、CD-ROMや電子ブック、DVD(デジタ ル・ビデオディスク)なども、重要な図書館資料になりつつあ る。このように、図書館で利用できる資料は紙の形態だけとは 限らない。

[4]さらに、近年のインターネットの発達により、 一部の資料については、図書館にわざわざ足を運ばなくても、 自宅等からインターネット経由でアクセスできるようになっている。 これについては次章で詳しく説明する。

第3章の先頭に戻る


3.6 第3章のまとめ

[1]この章では、図書館資料について学習した。図書館資料は、 大きく一次資料と二次資料とに分けられ、一次資料に関しては、

などがあり、二次資料としては、 などがあることを学んだ。

[2]二次資料(参考図書)に関しては、第5章と第6章で、実 例を交えながらさらに学習していく。一次資料については、一 般的な情報あるいは学術情報の流れのなかにおける、それぞれ の位置づけ・特徴をしっかりと把握しておいて欲しい。

第3章の先頭に戻る


3.7 練習問題

1.自分の身近な図書館で、どのような新聞が所蔵されているか を調べてみよ。また、それはどのような形態で保存されている か。

2.自分の身近な図書館で所蔵されている会議資料にはどのよう なものがあるかを調べてみよ。

3.自分の身近な図書館で、10誌程度の雑誌をでたらめに選んで、 抄録が付されているかどうかを調べてみよ。また、抄録の長さには、 特徴的な差があるかどうかも分析してみよ。

4.最近のある事件について、異なる数種類の新聞に掲載された 記事を比較して、その情報の質や量に差異があるかどうかを分析してみよ。

5.複数の索引(具体例は第5章を参照)を調べて、その書誌事項 の記述にどのような差異があるかを調べてみよ。また、それぞれの長短も 分析してみよ。


第3章の先頭に戻る

→全体の目次へ戻る