アドホック・エッセイ&備忘録:2008年04月29日)
水野貴明(著)『Google の全てがわかる本』その2:検索テクニック
[同書のPart 3:「正しい検索テクニックを知ろう(pp.71-139)]
Googleの検索エンジンの仕組みがわかったら、次は具体的かつ有益な検索テクニックを身につけたい。
Googleは多くの人が使っており、検索テクニックもかなり知られている。そこで、一般的に知られていることは省略し、なんとなく知られているが、十分にその有効性が理解されていないため活用されていないものに限定して、バートランド・ラッセル関係情報の検索を例に、以下、備忘録としてまとめておきたい。
- Googleでは最大32個のキーワードを同時に指定して検索可能である。ただし、キーワードを並べる順序によっても検索結果の表示順序が変わるとともに、日本語のキーワードは単語に分解され検索が実施されるので、十分注意が必要である。
→ 以前、検索語は10個しか指定できなかったが、いつの間にか32個に増えていた。
(検索例:「日本バートランド・ラッセル協会」で検索すると、トップにラッセルのポータルサイトのトップページがくる。アンカー・テキストが「日本バートランド・ラッセル協会」であるものがひっかかったように見えるが、これは勘違いである。実際にどのような検索が行われたかは、Googleのキャッシュを見ることで知ることができる。キャッシュ情報を見ると、検索語が'色づけ'されており、「日本バートランド・ラッセル協会」という言葉は、「日本」「バート」「ランド」「ラッセル」「協会」に分解され、それぞれの語で検索され、その後「論理積」がとられていることがわかる。つまり、「日本バートランド・ラッセル協会」という一語で検索されたのではなく、6語で検索され、その後'論理積'がとられている。従って、32個までキーワードが指定できるといっても、単語に分解された後の総数であることに注意する必要がある。)
- 単語への分解を防ぐためには、ダブル・クオーテーションで囲んで検索。ただし、省略語が使用されたページが対象外となるので要注意。
→ 上記のようなことを避けるためには、ダブル・クオーテーション("日本バートランドラッセル協会")で囲んで検索をすれば、「日本バートランドラッセル協会」を一つのキーワーと解釈して検索してくれる。しかし、注意が必要である。容易に想像できるように、「ラッセル協会」「日本ラッセル協会」「バートランド・ラッセル協会」と入力されたページはひっかからなくなる。通常は、ラッセル協会と入力されている場合が多いかもしれない。
- 指定した単語を「含まない」ページは、「-」(半角のマイナス)を単語の前に付与する。
→ これは知っていても、余り活用されていないのではないだろうか。これは便利ではあるが、該当するページを排除してしまう危険もある。検索結果が多すぎるときに、補助的に使うのが望ましい。
(検索例:俳優のラッセル・クロウに関するページがかなりあるので、「ラッセル -クロウ」で検索すると、「ラッセル・クロウに関するページが排除されるのはよいが、ラッセル・クロウも含め、いろいろなラッセルがリストアップされたページも排除されてしまう。
- Googleは外来語の表記の違い(例:ベネチアとヴェネチア)を救ってくれるが、キーワードの前に「+」(半角のプラス)を付与すると、表記の違いを混在させないで検索可能となる。
(検索例:このテクニックを使えば、たとえば「ラッセル +パラドクス」と「ラッセル +パラドックス」のどちらがよく使われているか知ることができる。)
「ラッセル +パラドクス」 ・・・ 119,000件
「ラッセル +パラドックス」 ・・・ 186,000件
- OR検索とAND検索を組み合わせて使う。Googleではまず「OR」に隣接しているキーワードをOR(論理和)検索の対象として認識し、その後、ORに隣接していないキーワードをAND(論理積)の対象とする。
→ 検索オプションのページでも同様のことができるが、各フィールドのキーワード指定はそれぞれ1つに限定されてしまう。従って、通常の検索ページで検索した方が、きめ細かな検索が可能となる。
(検索例:「ラッセル 論理学 OR 数学基礎論」
「ラッセル アリス OR ドラ OR パトリシア OR エディス」
- 海外の日本語サイト(海外在住の日本人のホームページなど)を検索する。
→ ウェブ全体に対し、日本語のページだけを限定して検索しても、日本にあるサイト(日本人が開設しているページ)がまず表示されるため、海外で日本語で発信しているサイト(ホームページ)をなかなか探しあてることができない。その場合には、メニューの「検索オプション」をクリックして、「検索対象国」をたとえば「イギリス」などと指定するとよい。ただし、アメリカにサーバをおいている企業や組織も多いので、「アメリカ」と指定しても余り効果がない。
(検索例:キーワード「バートランド・ラッセル」+対象言語「日本語」+対象国「イギリス」で検索すると、次の「志村博の英国エッセイ」がトップに表示される(このサイトには、バートランド・ラッセルについての記述がかなりある)。(注:現在は見当たらず、代わりに「志村博のケンブリッジ・ダイアリー」というページだけがある。)
志村博のケンブリッジ・ダイアリー
- ホームページの本文、タイトル、アドレス、アンカー・テキストのいずれかに検索範囲を限定する。
(検索例:下記のように限定する。ただし、検索語は半角入力とする。)
intitle:Bertrand Russell
intext:"ラッセル 来日" (フレーズ検索も併用できる。)
inurl:russell
(注:Googleは、URLも/やピリオドを区切りとして分解してしまうので要注意)
inanchor:バートランド・ラッセル
なお、すべてのキーワードを特定の場所から検索するには、allintext などを使用する。
- 特定の形式(PDF、DOC,XLSなど)のデータだけ検索
(検索例:「バートランド・ラッセル filetype:PDF」
- ワイルドカードの使用
→ ラッセルの英文の検索をする場合、正確な文章を覚えていないときは、ワイルドカード(*)を使用する。
(検索例:ラッセルの有名な文章「A stupid man's report of what a clever man says is never accurate」は、正確にフルに入力して検索すると多数ひっかかる。正確に覚えていない場合は、たとえば、「stupid man's report * never accurate」というように、ワイルドカード(*)を使って検索するとひっかかるはずであるが、「*」を2つ入力しないとひっかからない。説明と違うが、省略語一語なら「*」一つだが、二語以上の場合は、「*」を2つ(即ち「**」と)入力しないといけないというのが正解(水野氏の勘違い)だろうか?