平成11年度
慶應義塾大学文学部
図書館・情報学科卒業論文
インターネット上における有害情報の
判定手法とフィルタリング
平成11年12月提出
19503025
遠藤 真
梗概
本稿の目的は、インターネット上の有害情報を回避する手段をソフトウェア・フィルタリングという側面から明らかにし、特に子供を確実に有害情報から守ることを実現しようとするものである。
T章ではインターネット上の有害情報について概観し、その規制について述べる一方、実際にどれくらいの割合で有害情報が存在するのか、その現状を調査した。U章では有害情報の回避手段のひとつであるソフトウェア・フィルタリングについて述べ、既存のソフトを用いて実際にフィルタリング実験を行った。V章では実際の有害なWebページから情報の有害性を示すキーワードを抽出し、その妥当性の検証実験を行うことで、有害性の判定手法を提示した。W章では、V章までの調査・実験結果をふまえ、新しいフィルタリングソフトの基本設計を提案した。
T章の調査では、ほぼ無作為に抽出した3000のWebページの中から77の有害なページが抽出された。その割合は全体の2.13%であり、有害情報の多さを示すものとなった。また、U章の実験では、有害でないページの閲覧成功率は67〜100%であったのに対し、有害なWebページのブロッキング率は23〜55%と、有害なページのブロッキングの難しさが明らかとなる結果が得られた。そして分析の結果、全文検索方式を行うソフトウェア・フィルタリングが有効であることがわかった。また、V章では179のキーワード抽出に成功し、実験によってそのうち166語が100の有害なWebページの中から1回以上検索された。このような結果から、有害性判定に必要な手法が明らかとなった。
序文
インターネットを通じての情報発信や受信は、必要な装置さえあれば簡単なことであり、その便利さに注目して世界中で利用者が増えている。日本でも利用者人口は増えつづけているが、情報量の多さや利用時の簡便さといった「光」の部分がある反面、有害情報といった「影」の部分も目立つようになってきた。
有害情報、といって真っ先に思いつくのはポルノに関する情報だろう。しかしインターネットにおいては、その利用を想定した法整備の遅れや、情報発信者の匿名性が守られることなどから、さまざまな分野の有害情報が氾濫している。インターネットを通じての薬物の違法販売がもととなって何人かの自殺者が出た事件などは記憶に新しく、また、現実には人の殺し方について書かれたWebページも存在している。
もちろん、個人の趣味の範囲で、そして法律の範囲内で有害情報を需要に応じて公開することに異議はない。しかし、インターネットが世界中の利用者に対してオープンなものである以上、不運にも、子供たちやそのような情報を見たくない人々が偶然それらを見てしまうこともあり得るのだ。その可能性がある以上、有害情報を野放しにするわけにはいかないだろう。
インターネット上の有害情報は、取り締まりの難しさや「表現の自由」という概念との関連などもあり、現段階では法的に規制するには限界がある。そこで、誰かが何か対策を施すのをただ待つばかりでなく、自主的に、効率的に有害情報から回避するための手段はないか、と考え、本稿において調査・研究を行った。
この卒業論文の作成にあたり、長期に及ぶご指導を通じて支え励まして下さった図書館・情報学科の上田修一教授に心から感謝し、ここに謝意を表します。
目次
梗概 @
序文 A
図・表リスト C
T インターネット上の有害情報とその規制 1
A インターネット上の有害情報とは
B インターネット上の有害情報が与える影響
C 法規制と自主規制
D インターネット上の有害情報の現状調査
U ソフトウェア・フィルタリング 20
A 有害情報とソフトウェア・フィルタリング
B ソフトウェア・フィルタリングの問題点
C 既存のフィルタリングソフトの比較実験
V 情報の有害性の判定手法 40
A キーワードによる情報の有害性判定
B 抽出したキーワードによる全文検索実験
C キーワードの妥当性検証
D 情報の有害性判定手法の活用
W 新しいフィルタリングソフトの提案 50
A フィルタリングソフト提案の意義
B 基本設計
C 基本設計後の課題
注・引用文献 59
図・表リスト
図
1 インターネット上の有害情報(項目別) 17
2 有害情報のソフトウェア・フィルタリング 21
3 全文検索型のフィルタリング 22
4 ブラックリスト方式のフィルタリング 24
5 ホワイトリスト方式のフィルタリング 25
表
1 有害情報についての定義の比較 2
2 小・中学生を対象とした有害情報の範囲設定 4
3 実験対象フィルタリングソフトの特徴比較 32
4 有害な語句を含む有害でないページの判定基準 34
5 フィルタリングソフトの実験成功率 35
6 CYBERsitterによるフィルタリング分析結果 38
7 情報の有害性を表す分野別キーワード 41
8 有害なキーワードの出現頻度 44
9 言葉の意味を間違えて検索された単語 46
10 レイティング基準「SafetyOnline」 54
T インターネット上の有害情報とその規制
A インターネット上の有害情報とは
インターネットでは簡単に情報発信を行うことができ、また、情報の入手も容易であり、近年、その利用者の増加は著しい。そこにはさまざまな種類の情報が存在しており、生活や個人の興味から企業活動に至るまで、その内容は幅広い。そしてその中には、有害情報も含まれている。
有害情報、といっても、それが意味するものは各個人によってさまざまである。例えば、10歳の子供にとってはポルノ写真が掲載されたWebサイトは有害であるが、30歳の、そういうものに興味のある大人にとっては何ら有害なものではない。このように、ある情報が有害かどうか、というものは各個人の置かれた立場や属性、年齢などによって変動するものであり、一律的に有害情報の内容を細かく定義することはできない。
しかし、だからといってインターネット上の有害情報を野放しにするわけにはいかない。そこには犯罪と直接、または間接的に結びつくものも存在しており、また、有害情報の氾濫を放置しておくことは、私たちのインターネット利用時におけるモラルの低下にもつながりかねない。さらに、成人向けの情報を入手したくない成人がいることも容易に想像がつくことであり、そして何より、自己判断能力の未熟な子供たちを、危険な有害情報にさらすわけにはいかないのである。
1 既存の定義
有害情報がどのようなものであるか、ということについての説明・定義付けは、漠然としたものから事細かなものまで、すでにいくつかなされている。そこで、それら既存の定義をいくつか集めて、どのような定義付けがなされているのか、現状を調査した。第1表は、その状況をまとめたものである。対象とした定義は、個人・企業によるものが3つ、フィルタリングソフトによるものが2つ、団体や会議などによるものが3つ、合計8定義である。表中の7項目については、各定義中で定義されている割合が高いものを挙げた。「性」にはポルノ、ヌード、性行為、といった言葉で定義されたものを含んでいる。同様に、「犯罪」には不法行為や犯罪手口の開示など、「暴力」には暴力、テロ、軍事・過激派、兵器など、「麻薬」には麻薬、違法薬物など、「人権侵害」には人種差別、性差別、中傷など、「宗教」には宗教、カルト信仰など、そして「金融取引」にはギャンブルなどを含んでいる。
第1表からもわかるように、「性」と「暴力」に関しては、すべての定義中に含まれていた。特に「性」に関しては、現在インターネット上の有害情報で最も入手しやすく、流通量の多い情報群であると容易に推測できる。また、「ギャンブル」を含んでいる「金融取引」については、アメリカで使用されている有害情報のフィルタリングソフトやイギリスの財団による定義中には含まれているものの、日本における定義には含まれていないのが特徴的だ。
第1表 有害情報についての定義の比較
性 |
暴力 |
犯罪 |
麻薬 |
人権侵害 |
宗教 |
金融取引 |
|
キッズ★コアラ (Web SENSE)1 |
○ |
○ |
○ |
○ |
○ |
○ |
|
高橋邦夫 (東金女子高校)2,3 |
○ |
○ |
○ |
○ |
○ |
○ |
|
瀧口樹良、久保美和子4 |
○ |
○ |
○ |
○ |
○ |
||
SafeSurf5 |
○ |
○ |
○ |
○ |
|||
Cyber NOT List (Cyber Patrol)6 |
○ |
○ |
○ |
○ |
○ |
○ |
|
電子ネットワーク協議会7 |
○ |
○ |
|||||
インターネット監視財団(イギリス)8 |
○ |
○ |
○ |
○ |
|||
RSACi(アメリカ)9 |
○ |
○ |
|||||
割合 |
8/8 |
8/8 |
4/8 |
4/8 |
4/8 |
4/8 |
3/8 |
出典:
1 ニューコアラ
. 有害情報分野. [1999-11-17], <http://www.coara.or.jp/kids/what/yugai_info.html>2 高橋邦夫
. 不適切な情報の例(1/2). [1999-11-17], <http://www.togane-ghs.togane.chiba.jp/report/unee98/sld010.htm>3 高橋邦夫
. 不適切な情報の例(2/2). [1999-11-17], <http://www.togane-ghs.togane.chiba.jp/report/unee98/sld011.htm>4 瀧口樹良
, 久保美和子. タイトル. [1999-11-17], <http://www.kiu.ad.jp/tech/research/f97/taki1.html>5
SafeSurf Internet Rating and Classification System. [1999-11-17], <http://www.safesurf.com/ssplan.htm>6
Cyber Patrol ? CyberNOT List Criteria. 1999-4-13, [1999-11-17], <http://www.cyberpatrol.com/cp_list.htm>7 電子ネットワーク協議会
. Rating-. 1999-6-19, [1999-11-17], <http://www.nmda.or.jp/enc/rating/rating-standard.html>8
Internet Watch Foundation. Internet Watch Foundation ? Rating Legal Material ? Rating And Filtering Internet Content A United Kingdom Perspective. [1999-11-17],<http//www.iwf.org.uk/rating/rating_r.html>9
Recreational Software Advisory Council. RSACi ? Home page. [1999-11-17], <http://www.rsac.org/homepage.asp>
2 独自の範囲設定
既存の定義についての調査結果をもとに、本稿を進める上での基礎となる、有害情報の範囲設定を独自に行った(第2表を参照)。
第2表 小・中学生を対象とした有害情報の範囲設定
性 |
ポルノ、ヌード、性行為、非一般的な性行為、異性愛、同性愛、個人広告 /デートサービス、 |
暴力 |
テロ、武器、兵器(爆弾)製造、軍事・過激派 |
犯罪 |
違法行為、犯罪行為 |
人権侵害 |
差別(人種、性)、中傷 |
金融取引 |
ギャンブル、詐欺行為、不正販売 |
薬物 |
違法薬物・麻薬 |
宗教 |
カルト信仰 |
その他 |
不快な描写、デマ、誤報、誤解や偏見を与える情報、不正確・未確認情報、個人情報、悪趣味、過度の恐怖、潜在的に有害な話題、アルコール、タバコ |
範囲設定をするにあたって、まず、対象は小・中学生程度の子供とした。これは、思考・判断能力が未熟である点や、その結果として情報が制限されることによる影響を受けにくい点などを考慮したためである。逆に高校生程度以上の年齢になると、善悪の判断力はある程度各個人に備わってきており、情報へのアクセスを一律的に制限することはひとりの社会人を育成することに対する妨げにもなりかねないと判断し、ここでは対象としなかった。
また、既存の定義の比較を参考にして、定義されている割合が高かった項目については勿論のこと、少数派だった項目についてもひとつずつ妥当性を検討した。
設定した範囲は大きく8つのカテゴリーに分類される。そしてそれぞれのカテゴリーの中に、具体的に全
33項目を設定した。これらの項目以外にも既存の定義に含まれていた項目があったが、表現が曖昧であったり、子供にとって本当に有害かどうか疑わしかったものは排除したり表現を改めるなどして、できるだけ具体的で明確な範囲設定になるような工夫をした。「その他」のカテゴリーに含まれる項目について具体的な説明を加えると、「不快な描写」とは排泄など不快感を与える内容について書かれた文章や画像などを指し、「個人情報」は個人宅の電話番号などについての情報を、「悪趣味」は常識的に趣味の範囲を逸脱した、倫理的に問題のある内容(例えば死体の画像)を指す。なお、これらの各項目の間に明確な境界線はなく、情報の内容によっては複数の項目に該当する場合もある。
既存の定義のうち、「キッズ★コアラ」については、特に子供向けであることが明示されているものであり、本稿で設定した範囲と対象がほぼ一致するが、本稿では「金融取引」を設定範囲に含めた点において相違している。その設定の背景には、インターネットに限らず子供が親の知らないところでダイヤルQ2などを通じて多額の金融取引を行った例や、“インターネットギャンブルの日本進出に伴う社会問題化”
1)などがある。先にも述べたことであるが、範囲設定を行って痛切に感じたことが、「有害情報の一律的な定義付けは不可能」ということだ。情報の有害性の判定は、各個人のもつ道徳や常識、価値観などに頼る面も大きく、その結果、有害情報の内容も十人十色となる。これは当然のことであり仕方のないことであるが、できるだけ各個人間の差を縮められるような視点で今後も研究が進められる必要がある。
B インターネット上の有害情報が与える影響
インターネット上の有害情報は、インターネット利用者にどのような影響を与えているのだろうか。
1 家庭における利用時
家庭におけるインターネット利用時に有害情報の影響を最も大きく受けるのは、小・中学生であると考えられる。高校生程度になれば物事の善悪の判断をする力や情報の取捨選択をする力も備わってくるだろうし、また、乳幼児には情報リテラシーが十分に備わっていないから、というのがその根拠である。
例えば自室にコンピューターを持っている小学生がいたとしたら、その子供は親の目を盗んで有害情報にアクセスすることもできるだろう。インターネットに接続して情報を入手することは非常に簡単なことであり、また、一度アクセスしてしまえば、膨大な量の情報を短時間に、誰にも知られることなく入手することができる。
a.
ポルノに関する有害情報の影響子供にとっての有害情報、といって真っ先に思いつくのがポルノだろう。ポルノに関する情報も、入手することは容易である。インターネットはさしずめ“店員のいないレンタルビデオ屋”
2)なのだ。ポルノサイトに限った話ではないが、インターネット上の有害情報には「
18歳未満お断り」といった内容の注意書きが多く見られる。しかしこの注意書きは、実際には何の拘束力も持たない。何らかの方法で利用者の年齢を認証するシステムを導入しているサイトもあるが、認証が行われるまでに有害情報を入手することが可能な場合も多い。つまり、ポルノ系のWebサイトにはトップページにもヌード画像が掲載されていることが多く、そのことを考慮すれば、年齢を認証する以前の問題として、子供が誤ってそういったサイトにたどりついてしまわないような対策が必要である。ポルノサイトの中には有料のものが多くある。「無料」と書かれていても、実際はダイヤルQ2を通じて国際電話回線を使用させる例が多く、情報料を徴収されることがほとんどである。このようなサイトは、クレジットカードによって料金を徴収している一般的な有料サイトとは違い、利用者の年齢を認証する手段がない上、そのやや複雑ともいえるアクセス方法の仕組みがよくわからずに「気がついたらダイヤルQ2を使っていた」ということにもなりかねないのである。もし仮に子供がそういったサイトにアクセスして情報を入手してしまったら、後になって請求書を見た親が驚くことになるだろう。情報発信者側はそこまで想定していないかもしれないが、子供がある程度の年齢になると性に対する好奇心を持つようになってくることは自然なことであり、そのような情報へアクセスしたいと考えることに何ら疑問はない。
なお、思春期の子供の性に対する関心についての議論は本稿の目的ではないので、ここではあくまで「好奇心によってポルノサイトを閲覧したいと考える子供がいる」という現実を紹介するにとどめることとする。
b.
ポルノ以外の有害情報の影響一般的に有害情報とはポルノに限ったものではないが、これは子供に対しても同じことが言える。
ポルノ以外で子供に悪影響を与える情報として、教育上不適切な情報(例えば偏った思想)や、精神的に強い衝撃を与えるような内容の情報(例えば極度に恐怖を与える文章や画像)、暴力的な内容の情報などが思いつきやすいだろう。特に暴力的なものに関しては、年少者による残虐な殺人事件などが起きるたびに「テレビゲームの与えた悪影響ではないか」という議論がなされているが、もしそれが事実であれば、インターネット上の暴力的な有害情報も子供に悪影響を与えるもののひとつとして議論されるようなことがあってもおかしくはない。
いずれにしても、子供の健全な成長を妨げるような情報は子供にとっての有害情報であり、ありとあらゆる種類の情報が氾濫しているインターネットにおいて、そのような情報が子供に悪影響を与えることも十分に考えられることである。
2 家庭以外での環境における利用時
a.
公共図書館における利用時日本の公共図書館における、図書館利用者によるインターネットサービスの導入はまだあまり多くはないが、すでに多くの図書館でこのサービスが実施されているアメリカなどでは、その利用に関する議論も多い。
公共図書館におけるインターネット利用の特徴として、不特定多数の、幅広い年齢層の利用者がいることが挙げられる。そしてそこには、ある情報を入手したい利用者もいれば、入手したくない利用者もいる。そのことを考えると、インターネットに接続できる端末を用意しただけでは、図書館として、情報を必要としている人だけに適切に提供していることにはならない。インターネット上には、ありとあらゆる情報が存在しているからだ。
インターネット上の情報量の多さについて考えたとき、その情報群の中にある特定の情報を図書館資料として提供する際にも問題は生じる。あらゆる図書や雑誌がすべての利用者にとって適切なものであるとは限らない、ということは、インターネット上の情報についても同じことが言えるのであり、図書館で特定の雑誌を購読しないのと同じように、インターネット全体へのアクセスを提供する必要もないのである。
3)しかし一方では、図書館が何らかの方法でインターネットへのアクセスを制限した場合、そこには新たに「検閲」という問題が生じることがある。利用者自身の方針で情報の取捨選択を行うのならまだしも、公共図書館の端末を通じてインターネットから情報を入手しようとしたとき、その一部が利用者の知らない間にフィルタリングされてしまっていたのでは、「知る権利」を侵害されていることになる、とも考えられるからである。この問題に関しての議論は、特にアメリカで盛んに行われており、どのようにして合法的に子供を有害情報から守るか、ということが課題となっている。しかし実際には、“インターネットフィルターを使わなければ子供を危険にさらすことになり、使えば違憲になりかねない”4)のが現状だ。したがってこの問題については、「何を有害情報とするか」という問題とともに、慎重に議論を重ねていく必要があるだろう。b.
企業における利用時インターネットの発展に伴い、インターネットに接続できる端末の導入が各企業でも進んでいるが、そこでも有害情報が多少なりとも影響を与えている。インターネットは情報収集やコミュニケーション、マーケティングの手段として欠くことのできないものとなっているが、ギャンブル情報へのアクセスなど本来の企業活動に関係ない利用により、従業員の業務効率の低下を招いたり、これらの無駄な通信トラフィックによりネットワーク設備が有効に活用できない等の問題が生じてきている。
5)企業における利用は、利用者が成人である場合が多く、そこで「有害情報」とされるものの内容は図書館におけるものとは違ってくる。仕事中に業務とは関係のない、例えば美術館のホームページを閲覧する従業員がいた場合、企業にとってそれは損失となる。つまり、子供や自分でコンピューターを所有しそれを自由に使える状況にある人などにとっては全くといっていいほど有害ではない
Webページも、企業における利用時には有害となり得るのである。しかし一方では、ポルノやギャンブルなど共通する有害情報も多い。ある従業員がポルノサイトに行き、その内容を端末に残したままにして、次にその端末を使う人がそのような内容を不快に思った場合など、セクシャル・ハラスメントとして訴訟問題にもなりかねない。6)以上のような点を考慮すると、企業においても、インターネットへのアクセスに対する制限が必要とされていることがわかる。
C 法規制と自主規制
1 法規制
日本の法律の中で、特にインターネットの利用に焦点を当てたものは、現時点では存在しない。そのため何か問題が生じたときには、既存の法律に当てはめて審議することになるが、インターネットはこれまでの社会にはなかったメディアであり新しい特徴を持つものであるため、法律の適用が難しいこともある。問題となる内容を有害情報に限定した場合にも状況はほぼ同じであり、インターネットの利用を視野に入れた法整備の必要性を強く感じる。
インターネット上の有害情報に関わる法律はいくつかあるものの、その議論を見てみると、ポルノに関するものが多いことがわかる。
a.
刑法175条この法律は、「わいせつな文書、図画その他の物を頒布し、販売し、または公然と陳列した者は、二年以下の懲役又は二百五十万円以下の罰金若しくは科料に処する。販売の目的でこれらのものを所持した者も、同様とする」と規定するものである。インターネットの利用に関して、ハードディスクに記録されているわいせつ情報が「わいせつ図画」であることを自明の前提としているかのような判例もいくつかある。しかし、この法律の適用には、情報そのものは無体物であり、わいせつ物という有体物のように「陳列」することができない、という解釈上の問題がある。判例を見る限りでは、現時点では「ハードディスクにある情報はいつでも文書や画像として復元できる」という理論のもとで法律の適用が行われているようだ。
7)b.
改正風営適正化法1999年4月1日から施行されたこの法律(正式には「風俗営業等の規制及び適正化等に関する法律」といい、元来のものを改正したもの)は、「店舗型性風俗特殊営業」や「無店舗型性風俗特殊営業」とは区別して「映像送信型性風俗特殊営業」という、“専ら、性的好奇心をそそるため性的な行為を表す場面又は衣服を脱いだ人の姿態の映像を見せる営業で、電気通信設備を用いてその客に当該映像を伝達すること(放送又は有線放送に該当するものを除く)により営むもの”8)を定義し、インターネットの利用を視野に入れて、前述の刑法175条ではカバーできない問題にも対応しようとするものである。
この法律にもいくつか問題点が指摘されている。それらは、@「映像送信型性風俗特殊営業」は届出制を導入しているが、それには表現の自由に対する規制として問題がある、Aホームページにおける
18歳未満者への有害画像の提供を防止する規制目的に対し、ユーザーの年齢認証が事実上困難である、Bこの法律でもやはり「わいせつ」の概念が曖昧である、などの点ある。9)以上の点などを考慮すると、この法律が適用されるかどうかは、最終的にはやはり人間の判断に委ねられることが多くなりそうだ。つまり、この法律でも、完全な有害情報への対策とはなり得ず、インターネットに関する法整備の難しさを示すものとなった。c.
児童買春、児童ポルノに係る行為等の処罰及び児童の保護等に関する法律1999年11月1日に施行されたこの法律は、主に「児童ポルノ」という部分でインターネットと関わることになる。“児童ポルノを頒布し、販売し、業として貸与し、又は公然と陳列した者は、3年以下の懲役又は300万円以下の罰金”10)と規定しており、すでにホームページで児童ポルノを閲覧させていたとして数件が摘発されており、逮捕者も出ている。11) 12)
この法律中での児童ポルノの定義は、“写真、ビデオテープその他の物で、@性交または性交類似行為にかかわる児童の姿態、A性器などを触る行為にかかわる児童の姿態で性欲を興奮させまたは刺激するもの、B衣服の全部または一部を着けない児童の姿態で、性欲を興奮させまたは刺激するものを視覚で認識することができる方法で描写したもの”となっているが、「性欲を興奮させまたは刺激するもの」とはどういうものを指すのかが明確ではなく、すでに書店などに混乱を招いている。
13)インターネット上の規制についても同様に線引きが難しい状況もあると思われる。また、漫画については何ら規定されておらず、この法律による規制はできない。しかし実際は、性的描写が主体となったアニメのWebページも多数存在しており、この分野についての法的規制も早急に行われるべきことである。この法律がインターネット上の有害情報(児童ポルノに関するもの)をどれだけ規制できるかということはまだ未知数であるが、実際に検挙の例もあり、問題解決のために多少なりとも貢献するものとなるのは間違いなさそうだ。
2 自主規制
有害情報に対する規制は、法的なものだけではなく、自主的に行おうとする動きもある。
a.
プロバイダーによる自主規制インターネット・プロバイダーの中には、特に子供向けに、自主的にインターネットへの接続を制限して有害情報を排除しようとするシステムを提供しているものもある。「既存の定義」のひとつとして紹介した「キッズ★コアラ」では、フィルタリングソフトを専用にアレンジしたものを利用し、また、子供向けのサーチエンジンも提供している。
14) 15)b.
サーチエンジンによる自主規制日本のサーチエンジンのひとつ、エキサイト(
http://www.excite.co.jp)は、ユーザーが検索サービスを利用する際、検索画面上の専用ボタンを選択することで、アダルトサイトの表現を含むサイトを検索結果から除外することができるサービスを開始した。入力した言葉で意図せず大量にアダルトページがサーチされてしまうときに使い、プロテクターのオン、オフも適時可能になっている。このようなサービスは、日本のサーチエンジンとしては初めてのものであり、子供向けのサーチエンジンの整備と並んで、今後、発展が期待されるサービスである。16)3 アメリカの通信品位法
a.1996
年通信品位法アメリカでは
1996年2月、テレビ番組やインターネット画面の性的あるいは暴力的な場面、電話以外の通信メディアによるわいせつな通信などについて規定した「1996年通信品位法」(Communication Decency Act of 1996)が、「1996年電気通信法」の一部として制定された。17) 18)具体的には、「下品で、明らかに不快な」情報を規制する法律であり、インターネット上での「わいせつ情報や文書」の掲載も禁止するものである。しかし同法案が成立するとともに反対運動が巻き起こり、また、いくつかの市民団体が、この法律は表現の自由を保障しているアメリカ憲法修正第1条に違反しているとして訴訟を起こし、1997年6月、連邦最高裁が違憲判決を下した。19)この法律はまた、@何を「下品」とするのか、という定義がなされていない、Aこの法律による規制を回避するためには
18歳以下のインターネットへのアクセスを一切禁止する以外に方法は考えられず、これは事実上不可能かつ不当である、などの理由により、法律家をはじめとした米国内外の専門家の反対にもあった。18)こうした一連の流れは、インターネット先進国ともいえるアメリカでも有害情報に対する規制が困難である現状と、そして有害情報の定義の難しさを明らかにするものとなった。
b.
新法の成立1997年にその一部の効力を失った1996年通信品位法は、その内容を変更し、1998年7月23日、通信品位法Uとして米国上院で可決された。1996年通信品位法では規制する対象物を「わいせつな」と定義していたが、通信品位法Uでは「有害な」という言葉に置き換えている。また、連邦通信委員会(Federal Communication Commission)のための調査・研究も兼ねて、インターネット助成金を受けている学校や図書館における有害情報を排除するシステム(フィルタリングソフト)の導入も義務づけている。20) 21)
4 規制の問題点と今後の課題
これまで論じてきたように、現段階では、法規制をインターネットに適用するには限界がある。したがって、法律上でいわゆる電子メディアの扱いをどうするか、という問題を早急に解決しなければならない。そのためには、インターネットの現状を理解した上での法整備が必要であることは明らかだ。
また、法規制に限らず、自主的に規制を行う場合でも、やはり有害情報の定義が問題となる。国や情報サービス提供者などが常に新しい情報に目を向け、何を有害とするか、ということを明確な方針を持って決定した上で規制を行うことが重要であり、インターネット利用者の権利を守るためにも慎重かつ迅速に行われることが望まれている。
D インターネット上の有害情報の現状調査
1 調査目的
インターネット上で、子供にとっての有害情報を入手することは意外と容易なことである。つまり、そこにはすでに多少なりとも有害情報が存在しているのだ。
TIFAP(The Internet Filter Assessment Project)の試算によれば、ポルノサイトの数だけでも22000以上に及び、さらに1日85サイトの割合で増えている。22)また、Steve LawrenceとC. Lee Gilesの調査によれば、インターネット上の情報のうち、ポルノサイトの割合はおよそ1.5%であり、これは政治関連の情報量よりも多い、ということがわかっている。23)このように、インターネット上に有害情報が存在する事実を確認して現状を把握することにより、子供たちを有害情報から守ることの必要性を認識することができると考え、日本語のWebページの中に存在する有害情報を調査した。
2 調査方法
まず、
3000のWebページをほぼ無作為に抽出した。抽出には、サーチエンジンのひとつ、インフォナビゲーター(http://infonabi.infoweb.or.jp)の「エキスパートサーチ」を使用した。検索対象言語を日本語に限定し、任意のひらがな1文字を入力して検索した。検索するサイトのドメインは実際のドメイン分布にあわせて調整し、同じドメインのページを複数ページ抽出しないようにした。このような条件で、ドメインごとにWebページを合計3000ページ抽出した。この方法は、Webページを多くのインターネット利用者が利用していると考えられるサーチエンジンを利用して抽出したことや、サーチエンジンもYahoo!JAPAN(http://www.yahoo.co.jp)などの登録型のものではなくロボット型のものを使用したことなどを考慮すれば、現状調査を目的としたWebページ抽出の方法としては適切であると判断した。そして、抽出した
Webページを1つずつ見ていき、A節で設定しておいた有害情報の範囲に基づき各ページの有害性を判定した。なお、判定に迷ったページについては、トップページや製作者、ドメイン名なども調査し、それらを参考にして判定した。調査期間は1999年10月29日から1999年11月13日までであった。3 調査結果
3000のWebページ中に含まれていた有害ページの数は77ページで、割合は全体の約2.57%であった。そのうち最も多かったのが、「性」の範囲に含まれるページで、64ページ(2.13%)だった(第1図を参照)。次に多かったのは「暴力」の6ページ(0.2%)で、「人権侵害」、「金融取引」、「麻薬」、「宗教」に関してはそれぞれ1ページ(0.03%)ずつ検出されたが、「犯罪」に関するページは今回の調査では検出されなかった。また、「その他」では、成人向け娯楽雑誌のタイトルのリストや、個人の住所や電話番号が掲載されているページ、非道徳的なページへのリンク集があった(計3ページ・0.1%)。

第1図 インターネット上の有害情報(項目別)
ポルノサイトだけに限定して結果を見ると、前出のLawrenceとGilesの調査(約1.5%)を約1%も上回る結果となった。これは、日本語で書かれたWebページに限定した場合、その中ではポルノサイトの割合が比較的大きいことを示している。
調査の中で、判定に迷うものもあった。それらは主に、「その他」の「アルコール」に含まれるかどうか、ということで迷った、酒造業者などによる酒の紹介や、「金融取引」の「ギャンブル」に含まれるかどうか、ということで迷った、競馬やパチンコなどの専門用語集などであった。それらは全部で29ページあったが、まず、「アルコール」については、@企業による製品の紹介のページである、A一般の小売点などで子供でも容易に目にすることができる・または(法律上は禁止されていても)入手することができる、BそれらのWebページがもととなって子供に悪影響を与える可能性は低い、ということを判断基準として、有害ページには含まなかった。 また、「ギャンブル」については、@ギャンブルについての内容が書かれたページでも、そこで直接金融取引を行うことはできない、A社会的側面から考えて、子供は競馬やパチンコなどのギャンブルに参加することには厳しい制約があり事実上不可能に近い、ということなどを考慮し、有害ページには含まなかった。
検出された有害ページの中には、画像だけのページはなく、すべてがテキストのみ、またはテキストと画像によって構成されたページであった。こうした特徴は、有害情報への対策を考える上で非常に重要なものである。
Webページ中に含まれる有害情報の割合の調査結果を、高いと考えるか低いと考えるかは人それぞれだろうが、全Webページ中には、多少の誤差はあるものの、約2.57%の有害ページが含まれているのは調査結果が示している事実である。子供がロボット型サーチエンジンで検索を行う可能性がある以上、有害ページを偶然にも見てしまう「事故」は免れないであろうから、何らかの対策が必要である。
以上のような分析をもとに、今回の調査によって、インターネット上の有害情報に対する制限を行うことの妥当性が検証できたと考えられる。
今回の調査では、非道徳的なページへのリンク集や性的な描写ばかりが書かれた掲示板など、思いもよらなかった有害情報に遭遇する場面も何度かあった。つまり、実際に
Webページを調査することは、現実的な問題への対策の基礎的なこととして、情報の有害性を判定し有害情報の定義付けを行うために必要不可欠なことであり、現時点における、最も有効な方法なのである。このことをふまえて、次章では、有害情報回避の手段として実際に用いられている、ソフトウェア・フィルタリングについて論じていく。
U ソフトウェア・フィルタリング
A 有害情報とソフトウェア・フィルタリング
我々は、例えば雑誌を購入する際に、自分の必要としている、あるいは興味のある情報をできるだけ多く含み、しかも無駄な情報のなるべく含まれていない雑誌を探そうとする。このように、情報のフィルタリングは、日常的に行われていることである。
24)この考え方を応用し、コンピューターを使って情報のフィルタリングを行うことができるように作られたのがフィルタリングソフトであり、それを用いてフィルタリングを行うのがソフトウェア・フィルタリングである。インターネット上の有害情報への対策のひとつとしても、ソフトウェア・フィルタリングを挙げることができる。その仕組み(第2図を参照)は、インターネット利用者が自主的に有害情報から遠ざかることができるものであり、また、情報発信者側に対する厳しい規制も要求されないので、現時点では有害情報から利用者を守るための手段として最も現実的であると考えられる。

第2図 有害情報のソフトウェア・フィルタリング
1 全文検索型のフィルタリング
この方式は、Webページ全体のテキストを検索するものである。フィルタリングソフトには有害性を判定する際に必要な語句を集めたデータベースがあり、それを参照して検索を行う(第3図を参照)が、この方式ではページ全体のテキスト中の語句とデータベース中のキーワードを照合する操作によってを検索を行うため、有害情報をフィルタリングできる確率は高い、という特徴を持つ。

第3図 全文検索型のフィルタリング
2 レイティング型のフィルタリング
フィルタリングの方式として最初に思いつくのは全文検索型であろうが、ソフトの性能をより高いものにしてフィルタリングの成功率を高めるために、レイティング型のフィルタリングも行われている。レイティング型のフィルタリングには、第三者が情報の格付けを行う「サードパーティ・レイティング」と、情報の発信者自身が格付けを行う「セルフ・レイティング」があり、「サードパーティ・レイティング」には、ブラックリスト方式とホワイトリスト方式がある。
a.
ブラックリスト方式あらかじめリストアップされた、「有害な」
WebページのURLリストを参照するのがこの方式だ(第4図を参照)。フィルタリングソフトはURLのリストと閲覧しようとしているWebページのURLとの照合操作を行い、リストに含まれていないURLのみ閲覧を許可する。必要以上にWebページへのアクセスを制限してしまうことがなく、情報へのアクセス権を保持しつつも有害情報だけを排除することができる、という理論上の特徴を持つ。

第4図 ブラックリスト方式のフィルタリング
b.
ホワイトリスト方式あらかじめリストアップされた、「有益な」WebページのURLリストを参照するのがこの方式だ(第5図を参照)。ブラックリスト方式と同様に、フィルタリングソフトはURLのリストと閲覧しようとしているWebページのURLとの照合操作を行うが、この方式ではリストに含まれているURLのみ閲覧を許可する。偶然問題のあるページが表示される、ということのまずない安全性が特徴だ。25)

第5図 ホワイトリスト方式のフィルタリング
c.セルフ・レイティング
情報の発信者自身があらかじめ設定された評価基準に基づいて、自分の発信する情報を格付けするのがセルフ・レイティングだ。これを行う際の基準としては、WWWコンソーシアム(W3C)という組織が1995年夏から開発を進めてきた「PICS(Platform for Internet Content Selection)」などがある。26)情報の発信者側がランク付けした有害性の度合いに関する情報をフィルタリングソフトなどによって読み取り、受信者側が設定したレベルに応じて表示、または非表示されることになる。この方式の導入によって、フィルタリングソフトによるWebページの検索が、より円滑に、また迅速に行われるようになる。
B ソフトウェア・フィルタリングの問題点
ソフトウェア・フィルタリングにはさまざまな問題点も指摘されている。それらは各方式によって違ったり、また、フィルタリングを行う場面によっても違ってくるものである。
1 全文検索方式の問題点
全文検索方式ではキーワードによる文字列検索を行うが、そのことに起因した問題点も多い。
a.
言語の問題どのような
Webページをブロッキングするか、ということを決定する鍵を握るキーワードのデータベースが、どの言語で書かれているか、ということは大きな問題だ。フィルタリングソフトは、アメリカではさまざまな種類のものが販売されているが、日本ではあまり目にすることがない。これは、他のさまざまなソフトと同様に、英語版のソフトは英語を用いる環境でしか有効ではない、ということを意味している。日本語のインターネット環境に対応するためには、当然のことながら、日本語(と英語など)のデータベースを持ったフィルタリングソフトを使うことが必要とされる。また、日本語以外の言語についてどのように対処するか、ということも問題となる。子供たちが偶然にも日本語や英語以外で書かれた有害な
Webページに辿りついてしまう可能性もあるからだ。このような言語の壁を越えることが重要な課題となっている。b.
画像の問題先にも述べたように、全文検索方式は文字列検索を行うものであり、そのほとんどは画像には対応していないのが現状だ。したがって、有害な画像を含みながらも有害なキーワードは含まないページはブロッキングされないことが多い。サードパーティ・レイティングやセルフレイティングによるフィルタリングは
URL単位で行われるため、画像や文字列といった表現方法の違いに影響を受けない。つまり、画像に関する問題が生じることも、キーワードによる文字列の全文検索が生み出す特有の問題点なのである。画像を検出するためには、文字列検索とは別に、新たな手法を開発しなければならない。アメリカでは新たにわいせつ画像を検出するブラウザーが開発されたり、
27)また、日本においてもわいせつ画像を監視するプログラムを用いたサービスが商品化されたりしているが、28)現時点では、画像を正確に処理するソフトは完成の域には達していない。より正確なフィルタリングを行うためにも、今後はテキストデータのみならず画像データのホームページについても自動レイティングシステムの研究が必要である。5)c.
文字列の問題画像は問題となるが、では、文字列検索に関しては何の問題もないか、というと、そうとも限らない。文字列に依存した検索により、思わぬ問題が生じることもある。例えば英語版のフィルタリングソフトが「
Sexton」という人名や地名をブロッキングしてしまった例などである。3)この問題は、英語に限ったことではない。日本語版のフィルタリングソフトでもキーワードのデータベースに依存しているものであれば、やはり同じような問題が生じることになる。これを避けるためには、より細かな語句の設定が必要となる。d.
その他の問題全文検索方式では、
Webページのテキスト全体をキーワード検索するため、ブロッキングされなかったページでも表示されるまでに時間がかかる。また、有害とされるキーワードが含まれているページは、そのページ自体が有害なものではなくてもブロッキングされてしまうことになる。つまり、必要以上にWebページをブロッキングしてしまい、インターネット利用者にとって有益な情報までをも見られなくしてしまう可能性がある。さらに、これとは逆に、婉曲的な表現はブロッキングされない、という問題もある。そして、ページ全体の有害性の度合いに応じたフィルタリングができないのも、この方式の特徴的な問題点である。ひとつひとつのキーワードに重み付けをすることは、ソフト製作者にとっても利用者にとっても困難な作業であり、現段階では実現されていない。つまり、該当するキーワードを含むか含まないか、という、二者択一的な判定が行われていることになる。また、当然のことながら、キーワードとして登録されていないものはブロッキングされず、その結果、有害情報を見逃してしまうこともある。
2 サードパーティ・レイティングの問題点
a.
ブラックリスト方式の問題点ブラックリスト方式では、ある有害ページがインターネット上に出現してからそのページの
URLがデータベースに登録されるまでに時差ができ、その間は閲覧が可能になってしまう。また、URLの登録は主に人手による作業に依存しているため、登録もれが生じることもある上、登録の作業には多くの手間と時間がかかる。b.
ホワイトリスト方式の問題点ホワイトリスト方式では、限られたページだけにしかアクセスすることができず、有益な情報へのアクセスが妨げられる可能性が高い。T章での調査結果からも明らかなように、全
Webページ中の有害情報が占める割合は数パーセントであり、そのことは、有害情報が存在していることを証明すると同時に、インターネット上には膨大な量の有害でない情報が存在していることをも意味するものである。その膨大な情報のリストを漏れなく作成することは事実上不可能であり、ホワイトリスト方式によるフィルタリングに依存することは、かなりの量の情報へのアクセスが制限されていることになる。ホワイトリスト方式も
URLの登録は人手による作業に依存する場合が多い。したがって、その作業には多大な手間と時間が必要とされ、フィルタリングソフト利用者に提供する情報すべてを選ぶことから、ブラックリスト作成よりも慎重なリスト作成が要求される。c.
セルフ・レイティングの問題点新しい
Webページを作るたびにランク付けするのは手間がかかり、また、ホームページ作成支援ソフトにもセルフ・レイティングを行うための機能は用意されていないことが多い。こうしたことを考えると、すべての、とまではいかなくても、多くのWebページ製作者が自分の発信する情報をあらかじめランク付けする、ということは現実的ではなく、これだけに頼ったフィルタリングはあまり意味がない。3 総合的な問題点
これまでに述べてきたような問題点以外にも、フィルタリングソフトは性教育やエイズ、ゲイの市民権、中絶などの情報についてブロッキングしてしまうことがある点、フィルタリングを行うことは第三者に情報選択を依頼しているのと同じことになる点、などの問題が議論されている。前者はフィルタリングソフトの環境設定を変更することで、また、後者は「第三者による情報選択はインターネット以外の場面でも日常的に行われている」という側面から考えることで、解決策のひとつにはなるが、必ずしも完全ではなく、そのほかの問題と併せて、フィルタリングソフトが今後直面する課題である。
29)C 既存のフィルタリングソフトの比較実験
1 実験の目的
現段階で実際に販売・利用されているフィルタリングソフトは、日本ではまだあまり多くはない。また、その中には企業や学校といった団体向けの製品もあり、家庭で利用できるものとなるとさらに選択肢は少なくなる。そこでフィルタリングソフトは今後さらに開発の余地があるものと考え、本稿では新しいソフトの基本設計を提案することを試みるが、その前に既存のソフトの性能を実験によって明らかにする必要がある。そうすることにより、実験によって得られた結果から、どのフィルタリング方式が最も優れているか、ということや、どういった特徴を盛りこめばフィルタリングをより正確に行うことができるか、ということなどを分析し、それを新しいソフトの特徴として役立てることができるからである。つまり、ここでいう「新しいソフト」というのは、既存のソフトの問題点を改良したものとなる。
2 実験方法
a.
対象フィルタリングソフト実験対象となるのは「
Cyber Patrol」、「CYBERsitterU」、「HazardShield体験版」、そして「SFS(Server-type Filtering System)」のラベルビューロソフト、の4つである。このうち「Cyber Patrol」と「CYBERsitterU」は、製品を店頭で購入できるものであり、「HazardShield体験版」は、ホームページ(http://w3shield.kddlabs.co.jp/)にURLを入力してフィルタリングを行うものである。また、「SFS」は、電子ネットワーク協議会が開発したフィルタリングシステムで、Internet Explorerに搭載されたフィルタリング機能からラベルビューロ(“レイティング基準でレイティングされたURLのデータベースを持ち、クライアントからの要求で、該当するURLのレイティング値を返すサービスを行うサーバ”26))にアクセスするものである。30)フィルタリングの方式としては、「
Cyber Patrol」がブラックリスト方式とホワイトリスト方式を、「CYBERsitterU」と「HazardShield体験版」が全文検索方式とブラックリスト方式を、「SFS」はブラックリスト方式を、それぞれ採用している。なお、その他の特徴を第3表にて比較した。
第3表 実験対象フィルタリングソフトの特徴比較
1Cyber Patrol2 |
CYBERsitter U3 |
HazardSheild 体験版4 | SFS ラベルビューロ5 | |
開発元 |
The Learning Company 社(米) |
Solid Oak 社(米) |
KDD 研究所(日) |
電子ネットワーク協議会(日) |
OS |
Windows95/98 、Macintosh |
Windows95/98 |
指定なし |
Windows95/98 、Macintosh |
価格 |
6800 円 |
9800 円 |
無料 |
無料 |
データベース更新頻度/価格 6 |
毎週/3600円 |
毎週/2000円 |
不明 /無料 |
不明 /無料 |
管理者による規制リストの追加 |
可能 |
可能 |
不可 |
可能 |
出典:
2
CYBERsitter home. [1999-12-8], <http://www.iqs-j.com/CYBERsitter/top.html>3
Cyber Patrol. [1999-11-27], <http://www.netmedia.solution.ne.jp/products/cp/index.html>4
KDD研究所. HazardShield --- Information. [1999-11-27], <http://w3shield.kddlabs.co.jp/info.html>5 電子ネットワーク協議会
. Rating and Filtering Information Page. [1999-11-27], <http://www.nmda.or.jp/enc/rating/index.html>注 1
Venditto, Gus. Safe computing. Internet World. Vol7, No.9, p.49-58 (1998).から比較項目を一部抜粋6 価格は購入翌年度以降の年間購読料
b.対象Webページ
実験に先立ち、まず、
Webページの収集を行った。収集したWebページは、@明らかに有害なページ、A有害と考えられるキーワードによりサーチエンジンで検索された、有害ではないページ、BT章の調査時に抽出された、明らかに有害ではないページ、の3種類に分けられ、それぞれが100ページずつある。このうち@については、まず始めにロボット型サーチエンジンである「goo」(http://www.goo.ne.jp)を使って「アングラ」というキーワードで検索を行い、検索結果から、ひとつの「アングラ系」といわれるサイトに行き、その中のリンクのページを足がかりとして70の有害なWebページを収集した。残りの30ページは、T章での調査時に抽出された有害なWebページの中から、最初の30ページを利用した。Aは、やはり「goo」を使い、有害情報に含まれている可能性が高いと考えた単語(アダルト、アングラ、ウィルス、SM、カジノ、恐怖、ギャンブル、糞、ゲイ、死体、18歳未満、心霊写真、セックス、大麻、テレクラ、ドラッグ、ヌード、バイセクシャル、爆乳、人妻、ヘンプ、未満、レズ)を検索し、結果の中で、これらの単語をコンテンツに含みながらも、全体的に考えて有害ではないページを収集した。これらのキーワードは、T章で設定した有害情報の範囲に基づき、また、有害なWebページを参考にして抽出したものである。ここでの有害性の判定基準は第4表に示した通りである。Bは、T章での調査時に有害ではないと判断された、最初の100ページを利用した。
第4表 有害な語句を含む有害でないページの判定基準
判定対象 |
判定基準(特徴的なもの) |
ページ製作者 |
●政府や警察などの公的機関 ●新聞社(スポーツ紙は除く) ●放送局 ●インターネット・プロバイダー ●その他の日常的なメディア |
コンテンツ |
●明らかに有害情報とは無縁である ●有害性の高い語句を使っているが、一般的な使用法である ●有害性の高い語句を、有害ではない意味合いを持たせて使っている ●日常的に目にすることができる類の製品の紹介 ●図書の紹介(有害指定を受けているもの、成人向けのものを除く) ●医学関連 ●コンピューター関連の解説(ハッキング、ウィルスなどを除く) ●映画やビデオの紹介(成人指定のものを除く) |
その他 |
●ヘッダーにのみ有害性の高い語句が使われているもの ●ページ内の語数が極めて少ないもの |
これら3つのカテゴリーに分類された各100ページずつ、合計300ページを、それぞれのソフトでフィルタリングし、正確にフィルタリングが行われたページ数を集計した。
実験を行う際にWebページの更新などの影響を避けるために、すべてのソフトの実験をできるだけ短時間(約3日間)で行った。また、ソフト使用者が規制の度合いなどを調整できる場合は、最も厳しい基準でフィルタリングを行うように設定した。ブラックリスト方式でのフィルタリングだけになる「SFS」のラベルビューロに関しては、データベースに登録されていないURLについては表示を許可して、他のソフトと同様に、データベースに登録されている内容のみを調査できるようにした。
3 実験結果
a.
実験結果の比較フィルタリングの成功率を表したのが第5表である。ここでいう「成功」とは、有害ページに対してはブロッキングが行われ閲覧ができなかったことを示し、有害でないページに対してはブロッキングが行われず閲覧ができたことを示す。3種類のWebページ全体に対する総合的な成功率を見ると、「Cyber Patrol」と「SFS」が74%で他の2つよりも優れていた。しかし、対象ページの種類別に見ると、これら2つはともに有害情報に対して正確にブロッキングが行われる確率が低く、全体的に見ても情報をブロッキングする割合が低いといえる。つまり、正確にフィルタリングが行われているかどうかが疑わしいという印象を受ける。また、有害ページとそうでないページとの間では、結果に大きな差があることは特徴的である。それとは反対に、「
CYBERsitter」と「HazardShield体験版」は、情報の種類別に見ても各種類別の検索結果にはそれほど大きな差がなく、比較的安定したフィルタリングが実行されていることがわかる。
第5表
フィルタリングソフトの実験成功率Cyber Patrol |
CYBERsitter |
HazardShield 体験版 |
SFS SafetyOnline |
|
フィルタリング方式 |
ブラックリスト、 ホワイトリスト |
全文検索、 ブラックリスト |
全文検索、 ブラックリスト |
ブラックリスト |
有害ページ1 |
24 |
55 |
52 |
23 |
有害でない ページ 12 |
100 |
67 |
74 |
99 |
有害でない ページ 23 |
98 |
84 |
73 |
100 |
全体の成功率 |
74% |
68.7% |
66.3% |
74% |
注 1 数値はフィルタリングに成功し閲覧できなかったページ数(他の数値と性質が異なるため便宜上網掛けで示した)
2 サーチエンジンによって検索された、有害なキーワードを含みながらも有害ではないページ(数値はフィルタリングに成功し閲覧できたページ数)
3 有害情報の現状調査時に抽出された、明らかに有害ではないページ(数値はフィルタリングに成功し閲覧できたページ数)
有害なページのフィルタリング成功率は23〜55%(ページ)と、決して納得できるものとはなり得なかった。その原因としては、実験対象となったWebページの内容が多方面にわたるものであったことが考えられる。つまり、成功率の低さが一般に有害と考えられている内容のもの(性や麻薬など)以外のものについても多数収集した結果だとすれば、このことはフィルタリングソフトがその現状に追いついていないことを示している。特にサードパーティ・レイティング型のソフトでの成功率の低さが目立つが、これは人手により収集された有害なURLのデータベースに依存したフィルタリングを行うため、比較的データを収集しやすいポルノサイトなどに関してはデータベースに追加登録されるのも早いであろうが、新しい種類の有害情報や、一目では判断しにくい内容のものについては登録が遅れる、もしくは見落とされてしまう可能性が高いことに起因すると考えられる。そしてその結果、サードパーティ・レイティング型のソフトである「Cyber Patrol」は、英語版のソフトで高い評価を受けている31)にも関わらず、日本語版では高く評価できるような結果は得られなかった。もともとアメリカで開発されたソフトであるだけに、日本語版の性能は多少の遅れをとっているようだ。4つのソフトの中では、規制対象(電子メールやニュースグループなど)や有害性の度合いだけでなく、インターネット利用時間の制限など、環境設定が最も充実していただけに、この結果はその長所を生かすことができないものとなった。
b.
「CYBERsitterU」によるフィルタリングの分析「
CYBERsitterU」では、アクセスログを記録しておくことができる。そこには閲覧できたページのURLと、ブロッキング対象となったキーワードやURLが残されている。これは実際のフィルタリング状況を把握する上で非常に重要なものである。そこで、そのアクセスログを分析し、有害なWebページ100ページ中ブロッキングされた55ページに対して、全文検索を行ったのか、あるいはURLによるブロッキングを行ったのか、その回数を調査した(第6表を参照)。
第6表
CYBERsitterによるフィルタリング分析結果対象:有害 Webページ100ページ(ブロッキング成功: 55ページ) |
|
キーワードによる ブロッキング (全文検索) 1 |
URL によるブロッキング 2 |
189 |
22 |
注 1 キーワードによりブロッキングを行った回数
2
URLによるブロッキングを行った回数
1、2とも、同一ページにつき複数回ブロッキングを行うことがある。
そのため、その数は必ずしもブロッキングしたページ数とは一致しない。
URLによるブロッキングは、@完全なドメインによるブロッキング(例:www.pileup.com)、Aドメインの一部によるブロッキング(例:www.sex)、という2通りの方法によって行われていた。Aについては、「www.sexy.com」などのドメインの規制に対して有効であるが、「nz.com」という文字列もブロッキング対象のひとつに登録されていたようで、まったく有害でない「www.mbj.mercedes-benz.com」というURLもブロッキングしてしまった例もあった。しかしこのような例は他にはなく、この方法にもそれほど不便さを感じることはなさそうだ。
キーワードによるブロッキングは、T章で設定した有害情報の範囲すべてにわたって行われていた。つまり、登録単語数に差はあるだろうが、さまざまな分野にわたって単語の登録が行われていることがわかる。単語によるブロッキング回数も多く、ソフトウェア・フィルタリングにおいて全文検索が有効であることがわかる。
c.
フィルタリングソフトの総合的な評価フィルタリングソフトのどのような性質を重視するか、ということで実験結果の評価も違ってくる。「有害情報のフィルタリング成功率」を「有害でない情報の閲覧成
功率」よりも重視するのであれば、少なくとも今回の実験で使用した4つのソフトでは不満が残るだろう。また、逆の場合、全文検索型のソフトの結果には不満が残る。しかし、フィルタリングソフトを総合的に考えれば、やはり満遍なくフィルタリングに成功するソフトが理想的であり、そうすると、全文検索型のソフトが現存するソフトの中では最も有用なものだと評価することができる。有害でないページをブロッキングしてしまわないことと同様に、有害情報をきちんとブロッキングできることも重要であり、その成功率の差があまりに大きいソフトはその性能を疑われることにもなりかねないのだ。
以上のように、実験結果は、全文検索型を採用しているソフトとレイティングだけに頼っているソフトの間の違いを明らかにするものとなった。これは、各方式の特徴的な問題点を実証するものであるともいえるだろう。総合的に考えて全文検索型のソフトの有用性が証明されたことになるが、そのことは、有害情報から回避するためのより有効な手段となる新しいフィルタリングソフト開発の際の重要な手がかりとなったことは間違いなさそうだ。
V 情報の有害性の判定手法
本稿ではこれまでに有害情報への対策のひとつであるソフトウェア・フィルタリングについて論じてきた。それをもとに新しいフィルタリングソフトの提案を行うが、その前にまず、どのように有害情報をその他の情報と区別するか、つまり有害性の判定手法が必要となる。
A キーワードによる情報の有害性判定
1 情報の有害性を示すキーワードの抽出
T章での調査結果から、
Webページ上の有害情報にはテキストが含まれている場合が多いことがわかっている。つまりキーワードによりWebページを有害なものとそうでないものとに分類することができる可能性は高いと思われる。そこでページ内を検索する上で必要となる、情報の有害性を示すキーワードを抽出した。抽出方法は、@U章でのフィルタリングソフトの実験中に得られた、全文検索型のフィルタリングを行う「
CYBERsitter」のアクセスログから、ブロッキングされた単語を抽出する、AT章での調査中に検出された有害なWebページと、U章での実験に使用した有害なWebページ100ページの中から同じカテゴリーに分類されることのできるページを比較し、共通して使用されている語句を抽出する、という2通りの方法をとった。その際、同一ページ内での出現頻度の高さなども考慮し、頻度の高いものを抽出する候補として検討する一方、頻度の低いものでも有害情報に含まれる可能性が高いものは抽出した。また、特に@に関しては、ブロッキングに失敗したWebページに注目し、それらを実際にひとつずつ見ることで、フィルタリングソフトのデータベースには収録されていないと思われる単語の抽出を試みた。以上のような方法で、179語を抽出した(第7表を参照)。
第7表 情報の有害性を表す分野別キーワード
性 |
AVギャル AV嬢 AV女優 H画像 SM 愛液 アイコラ 喘ぎ声 アソコ アダルト画像 アダルトグッズ アダルト検索エンジン アダルトコンテンツ アダルトサイト アダルトビデオ アナル アヌス イメクラ 陰茎 淫乱 淫猥 裏ビデオ 裏ホームページ エッチ体験 エッチなページ エロアニメ エロ画像 エロ漫画 エロリンク オナニー おまんこ 官能小説 顔シャ 顔面シャワー キャバクラ 局部 巨乳 近親相姦 グラビア クリトリス ゲイ 拷問 18禁 3P SEX ザーメン 歳以下禁止 歳以下の方 歳未満閲覧 歳未満お断り 歳未満立 歳未満の方 歳未満のご 熟女 処女 スカトロ スケベなコギャル ストリッパー スペルマ スワッピング 精液 性感 性器 性教育 性交渉 成人向 性的 成年コミック 性表現 セックス 早漏 ソープ 遅漏 大陰唇 男根 チ○ポ 痴漢 乳首 膣 ちんぽ ツーショットダイヤル テレクラ 伝言ダイヤル 盗撮 ナマアシ ニューハーフ ヌード ノーパン ノーモザイク バイブ 爆乳 ハメ撮り パンチラ 美脚 人妻 美乳 フーゾク 風俗嬢 風俗情報 フェチ フェラチオ ブルセラ ブルマー ペニス ヘルス ホテトル ホモセクシャル ホモセクシュアル ポルノ マ○コ マゾ みそパン モロ画像 レズビアン ロリータ ロリコン ラブホテル 流出ビデオ 輪姦 レイプ 猥褻 |
暴力 |
MRTA 過激派 酒鬼薔薇聖斗 サバゲ 残虐な表現 死ね 戦車 弾薬 血しぶき トゥパク・アマルー革命運動 日本刀 バタフライナイフ 東アジア反日武装戦線 兵器作成 兵器製造 |
犯罪 |
悪徳商法 サイドビジネス 詐欺サイト 殺人 |
人権侵害 |
デブ ブサイク ブス メスブタ |
金融取引 |
オンラインカジノ バーチャルカジノ |
薬物 |
合法ドラッグ 合法麻薬 シンナー スマートドラッグ 大麻 ドラッグ販売 ナチュラルドラッグ ハッシッシ 媚薬 マリファナ |
宗教 |
右翼 オウム真理教 左翼 尊師の歌 反天皇制 法の華 |
その他 |
Q2 情報サービス UG WAREZ アングラ 裏情報 裏リンク 怪文書 危険文書 危険リンク 鬼畜 恐怖 グロ 事故写真 死体 女性性器切除 日コン連 有害コンテンツ |
2 キーワード抽出において留意した点
単語を抽出する際には、次章で提案するフィルタリングソフトにとって有用なものとなるように注意した。具体的には、
Webページの全文テキストを検索する際に検索ミスを少なくできるように、ひとつひとつの単語が文章中でどのような位置付けになり得るか、ということを考慮することである。その際に特に問題となったのは、略語や表記法についての問題や、部分一致によって検索したい場合とそうでない場合があることなどである。
a.
略語や表記法の問題略語で表されるのが一般的か、それとも正式な名称で表されるのが一般的か、という問題や、どのような表記法(ひらがな、カタカナ、アルファベット、など)で表現されるのが一般的か、という問題は全文検索を行う上で障害となる場合がある。特に略語に関しては、まったく別の単語の一部となっていないか、ということに対して注意を払う必要がある。
b.
部分一致により不都合が生じる場合例えば、「アダルト」という単語だけでは、その語を含む
Webページをブロッキングしようとするとき、「ヤングアダルト」という語が含まれるページをも部分一致(この場合は後方一致)によってブロッキングすることになってしまうが、このような語は有害情報ではないものにも含まれている可能性は大いにあり得るのである。したがって、「アダルト」という単語だけを抽出するのは不適切であり、「アダルトビデオ」など、他の語との組み合わせを考える必要がある。c.
部分一致による検索に依存する場合有害ページにはよく「
18歳未満お断り」のような注意書きが見られるが、「18歳」という規制は日本のものであり、アメリカなどのサーバーから情報発信しているWebページには「21歳未満お断り」のような注意書きがなされている場合が多い。また、「15歳未満お断り」などのような注意書きにも対応できるよう、年齢は特定せず、「歳未満お断り」というような抽出方法をとった。しかしここで「歳未満」という部分だけを抽出した場合、例えば生命保険の分野など、有害でないトピックを扱ったWebページもブロッキングしてしまう恐れがあるため、「歳未満」という単語は他の単語と組み合わされるのが適当と判断した。B 抽出したキーワードによる全文検索実験
1 実験目的
A節で抽出したキーワードの中には、実際に検索を行う上で本当に役に立つものかどうかわからないものもあった。そこでその妥当性を検証するために、実際に有害な
Webページ上を検索することが必要であると考え、実験を行った。2 実験方法
U章での実験に使用した有害な
Webページ100ページのテキストをすべて選択し、それをコピーしてワードパッドへ張り付けた。そしてそのソフトの検索機能を使用して、ひとつずつの単語を検索した。その際、「単語単位で探す」、「大文字と小文字を区別する」というチェックボックスはそれぞれ空欄にしておいた。キーワードの評価は、検索される回数、つまり出現頻度により行うことにした。各分野別のページ数やキーワード数に違いがあり、単純に数を比較することができないため、評価はあくまで出現頻度を数字で表すにとどめることにした。
3 実験結果
キーワードの出現頻度には大きな差が出た(第8表を参照)。1つの
Webページ中で同じ単語が何度も使われている場合もあり、出現頻度の差は必ずしも出現ページ数の割合と一致するものではないが、「その他」のカテゴリーに属する上位2語(「日コン連」、「MRTA」)を除くと、やはり有害性の高いキーワードとして思い浮かびやすい単語が上位を占めており、多くのページで使用されていることがわかった。
第8表 有害なキーワードの出現頻度
出現回数 |
性 |
性以外のもの |
0 |
H 画像 スケベなコギャル ホモセクシャル 顔シャ 顔面シャワー 歳以下禁止 歳未満お断り 歳未満のご [8語] |
Q2 情報サービス 合法ドラッグ 尊師の歌 兵器製造 有害コンテンツ [5語] |
1 |
アダルトグッズ アダルトコンテンツ アダルト画像 アダルト検索エンジン エッチなページ エロアニメ エロリンク エロ画像 スワッピング ツーショットダイヤル ノーモザイク ホテトル ホモセクシュアル みそパン モロ画像 淫猥 官能小説 歳未満立 性交渉 成年コミック 早漏 遅漏 裏ホームページ 流出ビデオ [24語] |
スマートドラッグ ドラッグ販売 ナチュラルドラッグ バーチャルカジノ ハッシッシ ブサイク 合法麻薬 詐欺サイト 残虐な表現 女性性器切除 東アジア反日武装戦線 媚薬 [13語] |
2 -5 |
AV嬢 アイコラ エッチ体験 エロ漫画 ストリッパー ナマアシ ニューハーフ 歳未満閲覧 成人向 大陰唇 風俗情報 AVギャル キャバクラ 拷問 歳以下の方 性教育 爆乳 美脚 猥褻 アダルトサイト 性表現 輪姦 スカトロ ラブホテル ロリータ 男根 美乳 [27語] |
シンナー バタフライナイフ 血しぶき 酒鬼薔薇聖斗 弾薬 裏リンク オンラインカジノ デブ 過激派 危険文書 反天皇制 トゥパク・アマルー革命運動 マリファナ 兵器作成 法の華 サバゲ メスブタ 左翼 [18語] |
6 -10 |
ロリコン 歳未満の方 イメクラ パンチラ ブルセラ ブルマー レズビアン 熟女 ハメ撮り 裏ビデオ 18禁 AV女優 ポルノ フーゾク 風俗嬢 アダルトビデオ マゾ [17語] |
サイドビジネス 鬼畜 死ね オウム真理教 悪徳商法 右翼 [6語] |
11-20 |
スペルマ テレクラ グラビア ソープ 性的 伝言ダイヤル 3P 盗撮 喘ぎ声 ノーパン 性感 局部 陰茎 [13語] |
危険リンク 怪文書 殺人 日本刀 戦車 [5語] |
21-50 |
人妻 ヘルス 愛液 性器 巨乳 ザーメン チ○ポ マ○コ レイプ 淫乱 フェチ 処女 フェラチオ 痴漢 アナル アヌス [16語] |
死体 大麻 裏情報 恐怖 WAREZ グロ アングラ [7語] |
51-100 |
膣 近親相姦 ちんぽ アソコ クリトリス 精液 [6語] |
日コン連 MRTA [2語] |
101-200 |
オナニー (121回) おまんこ(123回) 乳首(126回) セックス(129回) ペニス(190回) [5語] |
|
201- |
ヌード (344回) SEX(371回) [2語] |
C キーワードの妥当性検証
1 キーワード検索により明らかになった問題点
a.
表記法に関する問題点A節で行った抽出方法であれば、ほとんどの単語が少なくとも1回は検索される、という予想をしていたが、1回も検索されない単語が合計
13語あった。その原因としては、単語内の文字の間に、スペースや他の文字が入った表記(例えば「H画像」なら「Hな画像」など)がなされている場合や、Webページ上では単なるテキストに見える文字列が、実は画像ファイルに組みこまれているものだった場合などが挙げられる。これらのことは出現回数の多かった単語にも言えることであり、キーワード検索の問題点のひとつと考えられる。言葉の意味するものと同じ用法で使われていても、各文字の間にスペースが入っていたり、画像ファイルの一部だったりするだけで、その単語は検索されなくなってしまうのだ。b.
部分一致による検索に関する問題点検索上の問題点としてもうひとつ挙がったのは、言葉の意味するものとは違う使われ方をしているが、同じ文字列で表された、またはその一部を含む単語を検索してしまったことである。第9表は、キーワード抽出時に想定できずそのような検索ミスが生じた5語を挙げ、正確に検索されたものとそうでないものの回数を比較したものである。ここでいう「正確に検索」というのは、例えば「ゲイ」ならばゲイに関する文脈で使われていたものを検索したことを指し、「検索ミス」とは、例えば「バイブ」なら「バイブル」など他の単語の一部となっていたものを検索したことを指す。
第9表 言葉の意味を間違えて検索された単語
SM |
ゲイ |
バイブ |
UG |
ブス |
|
出現回数 |
43 |
6 |
51 |
147 |
17 |
正確な使われ方をされていたもの |
15 |
3 |
38 |
139 |
1 |
他の単語の一部となっていたもの |
28 |
3 |
13 |
8 |
16 |
第9表で示した5語については、「単語単位で探す」というチェックボックスに印をつけ、それを実行するような検索も行ったが、「
SM」は15回検索され、検索ミスは1回にとどまったものの、他の4語は、検索される回数そのものが0またはそれに近いものとなってしまった。こちらが意図していた「単語」の概念と、ソフトに定義付けられた概念との間には何らかの違いがあったようだ。特に検索ミスの回数が多かったのが、「ブス」である。この単語は、検索されたもののほとんどが、いわゆる中傷に当たる「ブス」とは違った使われ方をしていた。そこで「単語単位で探す」という操作を行ったが、やはり正確な検索は行われなかった。他の4語と比較してもこの単語の検索ミスはあまりにも多く、検索を実行するためのキーワードとしては不適切であることがわかった。
2 キーワードの妥当性検証
前項において「ブス」という単語が検索上不適切であることが証明されたが、その他に妥当性が疑わしかったのは、「日コン連」と「
MRTA」である。これらの単語は、出現回数が多いにもかかわらず、そのほとんどは同一ページ内で使われていたものであり、一般的なものともいえない。しかし、出現回数は多くても検索ミスはなく、また、これらの単語が他の単語の一部としては使われにくい文字列によって構成されていることから、検索を実行するためには特に不適切ではないと判断した。以上の3語以外の単語については、有害情報の内容を的確に表現したものであると考えられ、また、検索の際にも特に目立った問題点がなかったことから、有害情報判定のためのキーワードとして妥当であると判断した。
D 情報の有害性判定手法の活用
これまでに情報の有害性判定手法について論じてきたが、これは実際にどのように活用されるのだろうか。
まず、フィルタリングソフトは特定の方式により有害性の判定を行うものであるが、本稿で紹介したようなキーワード検索による判定手法は、フィルタリングソフトの基礎的なモデルである。
また、抽出したキーワードは検索に必要なデータベースのモデルとして活用できる。実際のソフトで使用されているデータベース中の語句の量は今回抽出した
179語の数百倍にも及ぶが、そうした大規模なデータベースにさえ登録されていない単語も数多く存在しているであろうから、そうした意味でも、この有害性を示すキーワードは有効であると考えられる。そしてそれらは実際のWebページから「抽出」されたものであり、実践的なものとしてソフトウェア・フィルタリングに活用されることが期待される。実際にひとつひとつの有害な
Webページに目を通してその内容を理解する作業は、わずか100ページではあったが長時間にわたって行われ、また、非常に大きな精神的苦痛を伴うものだった。つまり、フィルタリングソフト製作者側は、コンピューターでは解決できない、このような大きな負担を強いられるのである。しかし、実際に有害なWebページを閲覧することは情報の有害性判定をする上で必要不可欠なことであり、より正確なソフトウェア・フィルタリングを実現するための基礎となる。このように、ソフトウェア・フィルタリングにおいて情報の有害性判定を行う仕組みを作り上げることは容易なことではなく、フィルタリングソフト製作がいかに困難であるかがわかる。そうしたこともふまえて、次章では、新しいフィルタリングソフトの提案を行い、どのようなフィルタリング方式や環境設定を採用すればより正確にフィルタリングを行うことができるか、ということについて分析する。
W 新しいフィルタリングソフトの提案
A フィルタリングソフト提案の意義
これまでに論じてきたように、インターネット上に数多く存在する有害情報の自主的な回避手段としてソフトウェア・フィルタリングは有効である。
V章で示した情報の有害性判定手法により、これまでのフィルタリングソフトのデータベースには収録されていないと考えられる単語も収集されたが、U章でのフィルタリングソフトの比較実験結果からもわかるように、既存のソフトによるフィルタリングは必ずしも利用者を満足させるものではない。
そこで、既存のソフトの問題点を考慮し、それを克服できるようなソフトを提案することによって、「どのようにすればより効果的・現実的に有害情報から回避することができるか」という問題解決への糸口をつかみ、本稿の目的を達成することにつながるのである。
B 基本設計
ここでは新しいフィルタリングソフトの基本設計を提案する。その際、既存のソフトのホームページ
32)やソフトウェア・フィルタリングに関する論文5)、既存のソフトについて解説がなされている論文31) 33)の中から、基本設計に必要と思われる項目を参照し、それらについて具体的に提案する。1 OS
ソフトが対応できるOSとしては、
Windows95/98とMacintoshは必須である。一般家庭で使用されている割合が極めて高いからだ。また、子供たちが学校や図書館におけるネットワーク環境下においてインターネットに接続することを考えれば、Windows NTにも対応できることが望ましい。2 フィルタリング方式
U章での実験結果から、ソフトウェア・フィルタリングには全文検索方式を採用することが有効であるとわかっている。また、本稿の実験用にも
100余りの有害なWebページのURLを収集したが、そのように実際に人手によって収集されたURLは非常に貴重なものであり、有効に活用することが期待される。そこで、フィルタリングをより正確かつ有効に行うためにも、ブラックリスト方式を全文検索方式とともに採用することが適切であると考えられる。セルフレイティングによるフィルタリングも行えるようにする必要がある。実際にレイティングが行われている
Webページ数の多少に関わらず、ほんのわずかな有害性判定要素も無駄にしないように工夫することが重要であるからだ。一方、ホワイトリスト方式については、学校での授業などある特定の目的に基づいたインターネット利用時には有効であると考えられるが、家庭や公共図書館などにおいてインターネットを利用する際には子供の情報要求の妨げとなることもあり得る。また、ホワイトリストの作成はブラックリストの作成以上に難しく、有識者の厳正な判断を必要とするため、その採用に関しては慎重にならなければいけない。さらに、ホワイトリスト方式を採用することは、他のすべての方式を採用しないことになり、利用者の年齢にもよるが、絶対的な必要性は薄いと考えられる。インターネットは有害情報などの問題を抱えるが、情報量の多さはその利点でもあり、その点を考慮しても、この方式については、他の方式との中で選択的に利用できる環境であれば採用することは問題ないが、少なくともこの方式だけを採用することはあまり好ましくないと思われる。したがって、本稿においては、ホワイトリスト方式は採用しないことを提案する。
3 環境設定
子供が勝手に環境設定を変更できないように、環境設定を行う際には管理者パスワードの入力を要求されるようにすることは非常に重要なことである。これは実際に既存のソフトにも採用されている。
a.
フィルタリング方式の選択複数のフィルタリング方式を採用した場合、そのうちのどの方式によってフィルタリングを行うのか、随時選択できるようにすると便利である。もともとソフトウェア・フィルタリングは第三者による情報選択を行うものであるが、間接的にでもその作業を子供にとって身近な人が行えるようにすることは、各利用者に合ったフィルタリングの実現に近づくことができるからだ。
また、前述のように、ホワイトリスト方式を採用した場合にはフィルタリング方式の選択が行えるようにすることは必須である。
しかし、「表現の自由」という概念に敏感な管理者などが何らかの確固たる意思を持って選択を行う場合はあるだろうが、一般的には基本的な設定を変更することはあまりないだろう。そこで、基本設定は全文検索方式とブラックリスト方式を併用するようにしておくのが無難であり、もっとも効果的なフィルタリングが行われることになると思われる。
b.
リストの追加多くのホームページを閲覧していけば、偶然にも有害情報に出会ってしまうことがある。そのような苦い経験を生かすために、キーワードや
URLのリストの追加ができるといいだろう。URLであれば管理者によってリストに追加される機会も多いだろう。また、キーワードの追加ができれば、ある特定の分野について、管理者の判断で確実にフィルタリングを行いたい場面などで有効である。c.
レベル設定サードパーティ・レイティングによるフィルタリングを行う際には、有害性の度合いを指定することが可能である。
URLの登録時、あるいは情報発信時にレベルを決定しておくことができるからだ。したがって、利用者の年齢に合わせてレベルを変更できるようにすると、より正確なフィルタリングが行うことができる。設定できるレベルは、電子ネットワーク協議会が提案しているレイティング基準「
SafetyOnline」(第10表を参照)を採用し、5つのカテゴリーそれぞれに対して5段階とすることを提案する。それに伴い、ラベルビューロ作成も同じ基準に基づいて行うこととなる。なお、「SafetyOnline」は、RSACiという、RSAC(Recreational Software Advisory Council)が提案する代表的な評価基準34)の4つのカテゴリー(「暴力」、「ヌード」、「セックス」、「言葉」)に「その他」というカテゴリーを加えたもので、一般的なレイティング基準に基づくものであり、その利用価値は高いと考えられる。
第
10表 レイティング基準「SafetyOnline」レベル |
ヌード |
セックス |
暴力 |
言葉 |
その他 |
0 |
なし |
なし |
なし |
不快感を与えない言葉 |
なし |
1 |
露出的な服装 |
セクシャルなキス |
争い |
穏やかな悪口 |
要注意 |
2 |
部分的なヌード |
着衣のままの性的接触 |
殺傷 |
悪口 |
公序良俗に反する |
3 |
全裸 |
性行為らしき描写 |
殺人 |
わいせつ表現 |
違法 |
4 |
性器の 強調 |
性行為 |
残虐 |
誹謗中傷 |
反社会的 |
出典:電子ネットワーク協議会
. Rating-. 1999-6-16, [1999-12-1], <http://www.nmda.or.jp/enc/rating/rating-standard.html>d.
ニュースグループとチャットニュースグループやチャットも監視すれば万全である。ここではキーワードのリストが有効となる。また、投稿も規制できるように、インターネットに向けての情報の出力も規制できるといいだろう。
e.
環境設定に関する留意点管理者が環境設定を変更した場合、変更点が確実に実行されているかどうかの検証が必要となる。つまり、環境設定の項目を増やし複雑にすればフィルタリング性能は上がるかもしれないが、検証の作業もそれだけ煩雑になるのだ。その点を考慮すれば、あまり複雑な環境設定は正確なフィルタリングの妨げにもなりかねず、適切ではない。わかりやすく、単純なものにして、管理者が使いやすいものにしておく必要がある。
31)4 キーワードと
URLのリストa.
キーワード全文検索を行う際のキーワードについては、V章でも述べたように、実際の
Webページから抽出することが有効である。実在するWebページを分析してキーワードをより詳細に設定することにより、婉曲的な表現や文字列に依存した検索に関わるミス、また、ひらがなやカタカナといった表記法の問題の克服に貢献するものとなる。文字間のスペースの問題は、それを無視して検索できるようなプログラムを作ることで解決できる。全文検索においては有害性の度合いに応じた検索、つまりキーワードへの重み付けが困難であるが、
HTMLファイルにおいて、<META>や<TITLE>などのタグ中に含まれる単語に対して任意の重みを加算する、といった手法はすでに提案されており、35)これを応用して、キーワードの出現場所による重み付けが可能となる。また、第9表からもわかるように、部分一致に関する検索上の問題点はそれほど深刻なものではなく、この問題に関しては、少なくとも現時点では特別な対策をする必要はなさそうだ。
b.URL
U章における実験に使用した「
CYBERsitter」のように、ドメインの全部、または一部によるブロッキングは有効である。有害情報を含むWebページが比較的多いドメインを特定することも可能な場合があるからだ。特にブラックリスト方式において、
URLが登録されるまでの時差の問題は、現在のところ、リストの更新頻度の高さによって解決するしかなさそうだ。したがって、絶え間なくWebページを監視する努力が必要とされる。c.
リストの規模リストの規模は、大きければ大きいほどいいのは言うまでもない。「
CYBERsitter」では、3万以上のURLと、約8万通りの「言葉の組み合わせ」を使用しているが、36)さらに正確なフィルタリングを行おうとすれば、それ以上必要となるだろう。d.
リストの更新頻度リストの更新頻度も、規模と同様に、多ければ多いほどいい。第3表からもわかるように、「
Cyber Patrol」、「CYBERsitter」とも毎週更新されている。常に新しい情報が流れこむインターネットの現状に対応するためには、最低でもその程度の頻度でリスト更新を行うことが必要なのだろう。こうした例を参考にすると、やはり週に1回以上の更新が望まれる。5 対象言語
日本語以外の言語にも対応しておくべきだろう。日本語以外で最初に注目したいのはやはり英語の
Webページだが、URL登録に関してはそれほど問題は生じないだろう。キーワードとなると、表現方法の違いや文化の違いなど、抽出の際に考慮しなければならない要素も多く、英語圏の文化に詳しい人によってリスト作成が行われなければならない。既存のソフトに関していえば、アメリカの企業によって開発されたものも多く、この問題に関してはそれほど苦労することはなさそうだ。
6 その他の機能
a.
アクセスログの表示この機能は、フィルタリングが正確に行われているかどうかを判断したいときや、フィルタリングとは関係なくアクセスログを保存したい場合などに有効である。表示の際に管理者パスワードが必要かどうか、という問題があるが、パスワード入力を必要としてしまうと、利用者である子供たちへの「検閲」という側面が色濃くなってしまうことから、不要とするか、必要としてもログの削除の場合だけに限定した方がいいだろう。
b.
クレジットカード番号に対する規制クレジットカード番号の送信ができなくなるようにするシステムが既存のソフトで使われている。その例には、カード番号や電話番号の入力を規制するもの(
Cyber Patrol)や、カード番号が(入力しても)空欄で送信されるようになるもの(CYBERsitter)、などがある。これらは子供が単独でインターネットを通じて金融取引を行えないようにするために有効である。c.
キャッシュのフィルタリングハードディスクに残されているキャッシュもフィルタリングするものでなければならない。フィルタリング機能を中断させた状態で誰かが有害情報にアクセスした場合、キャッシュのフィルタリングが行われなければ次の利用者にとってフィルタリングソフトが搭載されていることの意味がなくなってしまうからだ。そのような事態を避けるためにも、この機能は必須である。
d.
ブラウザの種類利用者が使用するブラウザの種類に影響されずにフィルタリングが行われなければならない。ブラウザを限定してしまうことは、他のブラウザのアンインストールが必要となるなど利用者にとって非常に不便なことであり、正確なフィルタリングが行われないことにもつながるからだ。
e.
インストールの簡単さひとつのソフトとして、インストール方法が複雑にならないように工夫することは当然のことである。そして、インストール後すぐにでもフィルタリングを開始できるような基本設定をしておくことも必要である。また、「
Cyber Patrol」はインストールすれば自動的に「スタートアップ」に組み込まれるようになっていたが、管理者パスワードを入力することで適宜フィルタリング機能の解除ができるのであればこのような仕組みは有用性が高い。当然のことながら、フィルタリング機能は子供が簡単に解除できるものであってはならない。C 基本設計提案後の課題
本稿の実験のために収集された有害な
WebページのURLのリストやそこから抽出されたキーワードは、ひとつのソフトのデータとしては微々たるものであるが、既存のソフトのリストに追加すれば有用なものとなるだろう。本稿において、実際に新しいフィルタリングソフトの開発は行わなかったが、これまでに論じてきた基本設計を元にソフトのモデルを作ることは可能であり、特にキーワードや
URLのリスト、そして有害性の判定手法において、既存のソフトが抱える問題点のいくつかを克服できるものとなるだろう。ソフトの基本設計を行い、実際にそれを開発するのは決して容易なことではないが、いちばん大切なのは、開発後に発見された問題点をいかに短時間に、正確に改善できるか、ということである。その地道な作業を繰り返していくことが、有害情報から私たちを守り、インターネットの持つすばらしさを実感しながら快適に楽しめることへとつながるのである。
注・引用文献
1)有害情報. [1999-8-5], <http://www.iqs-j.com/CYBERsitter/i4.html>
2)“子どもには見せたくない!?“有害”ホームページの周辺:上”. 朝日新聞. 1999年8月17日, 朝刊, 25面.
3)Banks, Michael A. “Filtering the net in libraries:the case (mostly) in favor”. Computers in Libraries. Vol.18, No.3, p.50-52,54 (1998).
4)Schuyler, Michael. “When does filtering turn into censorship?”. Computers in Libraries. Vol.17, No.5, p.34-35,38 (1997)
5)清水昇. “インターネットにおけるフィルタリングシステム”. 機械振興. Vol.31, No.4, p.45-53 (1998)
6)
Retkwa, Rosalind. “Corporate censors”. Internet World. Vol.7, No.9, p.60-64 (1996)7)園田寿. “コンピュータ・ネットワークとわいせつ罪”. ジュリスト/増刊「変革期のメディア」. p.168-172 (1997)
8)警察庁. 改正風営適正化法のあらまし. [1999-11-17], <http://www.npa.go.jp/kankyo/abstract.htm>
9)藤原宏高, 井奈波朋子. “サイバースペースにおけるコンテンツ規制を考える”. 情報通信学会誌. Vol.16, No.1, p.29-40 (1998)
10)
警察庁. 概要. [1999-11-17], <http://www.npa.go.jp/syonen/gaiyo.htm>11)
“児童ポルノを掲載容疑逮捕:禁止法を初適用”. 朝日新聞. 1999年11月12日, 朝刊, 39面.12)
“Teen held for child porn possession”. The Japan Times. 1999年11月26日, 2面.13)
“「児童ポルノ」ってどんな本?”. 朝日新聞. 1999年12月6日, 夕刊, 14面.14)
“Internet provider to offer service to block page access”. The Japan Times. 1999年3月12日, 2面.15)
有害情報. [1999-11-17], <http://www.coara.or.jp/kids/what/sikumi.html>16)
エキサイト、アダルトサイトを除外できる新機能「プロテクター」を開始. 1999-11-10, [1999-12-2], <http://www.watch.impress.co.jp/internet/www/article/1999/1110/excite.htm>17)
清家秀哉. “アメリカの1996年電気通信法の概要”. ジュリスト/増刊「変革期のメディア」. P.59-65 (1997)18)
木下泰. ANTI_CDA. [1999-11-23], <http://www.kinoshita.com/cda.shtml>19)
瀧口樹良, 久保美和子. タイトル. [1999-8-5], <http://www.kiu.ad.jp/tech/research/f97/taki1.html>20)
日経BP社. 米上院で通信品位法(CDA)Uが可決.1998-7-25, [1999-11-29], <http://biztech.nikkeibp.co.jp/biztech/usnews/article/19980727/02.shtml>21) C-J-S Floor Approval. [1999-11-29], <http://www.senate.gov/~appropriations/99cjsflr.htm>
22) Willems, Harry.
“Filtering the net in libraries:the case (mostly) against”. Computers in Libraries. Vol.18, No.3, p.55-56,58 (1998)23) Lawrence, Steve.; Giles, C. Lee.
“Accessibility ofinformation on the web”. Nature. Vol.400, 8July, p.107-109 (1999)24)
森田昌宏, 速見治夫. “情報フィルタリングシステム:情報洪水への処方箋”. 情報処理. Vol.37, No.8, p.751-757 (1996)25)
“子どもには見せたくない!?“有害”ホームページの周辺:下”. 朝日新聞. 1999年8月19日, 朝刊, 23面.26)
電子ネットワーク協議会. SFS-. 1999-6-16, [1999-11-15], <http://www.nmda.or.jp/enc/rating/sfs-glossary.html>27) Technology News from Wired News. 1999-6-18, [1999-6-22], <http://www.hotwired.co.jp/news/news/technology/story/2622.html>
28)
“ネットの「有害」情報検出”. 日本経済新聞. 1999年7月29日, 17面.29) Burt, David.
“In defense of filtering”. American Libraries. Vol.28, No.7, p.46,48 (1997)30)
電子ネットワーク協議会. SFS-. 1999-10-1, [1999-11-15], <http://www.nmda.or.jp/enc/rating/sfs-faq.html>31) Venditto, Gus.
“Safe computing:seven programs that filter internet access”. Internet World. Vol.7, No.9, p.48-56,58 (1996)32) Cyber Patrol. [1999-11-30], <http://www.netmedia.solution.ne.jp/products/cp/>
33) Oder, Norman.
“Krug’s toughest fight?”. LibraryJournal. Vol.122, No.8, p.38-41 (1997)34) Recreational Software Advisory Council. RSACi Home page. [1999-12-2], <http://www.rsac.org/homepage.asp>
35)
森幹彦, 山田誠二. “ブックマークエージェントによるURLの協調的情報フィルタリング”. 人工知能基礎論研究会. 29回, p.7-12 (1997)36) CYBERsitter home. [1999-12-8], <http://www.iqs-j.com/CYBERsitter/top.html>