home > サービス一覧 > eEgg79 オプションサービス > オプションサービス詳細


NAMAZUで高速全文検索



全文検索について、ご存知ですか?
全文検索とは、私達が何気なく使っている検索システムの大半にあたる検索方法です。最近人気の「Google」等、インターネット上の検索サービスの多くもこの方法に該当します。また、最近のOSにも標準で全文検索機能が搭載されています。全文検索には、あらかじめインデックスを作成するものと、そうではないもの、と大まかに二通りの方式があり、状況で使い分けられています。弊社オプションサービスのNAMAZUは、前者のインデックスを作成する方式で、高速に全文検索を行う事が可能となっています。


NAMAZUとは……
現在最もポピュラーな全文検索システムのひとつで、多くのWebサイトやメーリングリストの過去メール検索システムとして運用されています。効率の良いインデックス作成と、高速な全文検索が特徴です。


他の検索エンジンとの違い
Namazu は可能な限り簡単・手軽に使える事を目標にして作られており、Webサーバーやイントラネットなどの小中規模での全文検索システムを、手軽に構築することができます。小中規模向け、とはいっても多くの運用実績から大規模なサイトでも十分動作可能です。UNIXやWindowsはもとより、OS/2、 BeOS等々、多様な動作環境に対応しています。


何に使えばいいのか?
お客さまが開設なさっているWebサイトの検索システムとして用いたり、メーリングリストの過去メール検索、社内サーバのデータベース検索等々、あらゆる検索用途にご利用いただけます。


設定などの管理が面倒なのでは?
設置・設定は、全て弊社にて行っております。また、インデックスファイルの作成・更新作業も弊社が行います(最高で1週間に1度)。


WordやPDFのデータが結構あるのですが?
Namzuを利用すれば、HTML等のテキストデータはもとより、電子書類のスタンダードともいえる、PDF(Adobe Acrobat)形式のデータも検索する事が可能です。PDF化された大量のマニュアル類の管理も楽に行えます。また、Microsoft Word、Microsoft Excel、PowerPoint、一太郎 9/10、Texフォーマットは、随時検証中です。


具体的にはどのように検索するのか?
一般的なAND、OR、NOT等の検索方法は勿論、より複雑な検索方法もご利用いただけます。 下記に検索の大まかな流れ図を用意いたしましたので、ご参考にしてください。また、具体的な検索式についても、下段に表で詳しい説明を載せております。併せてご参照下さい。



検索画面の一般的な例です。検索操作はブラウザから行う形になります。
一番上の空欄に、検索したい単語と検索式を入力します。この例では「NAMAZU」と「メーリング」リスト、二つの単語をAND検索しています。 1
検索したい単語を入力したら、検索結果の表示スタイルを指定します。 ここでは、ヒットした単語の件数を、一ページに幾つ表示するか設定できます。 2
ここでも検索結果の表示スタイルを指定します。 検索結果には、ヒットした単語が含まれているページの概要が表示されますが、「簡潔」を選ぶと概要が省略されます。 2
検索結果の表示スタイルの設定はこれで終了です。 ここでは、検索結果をどのような順番で表示するのか設定できます。一般的な検索システムの場合は、たいてい標準ではヒット率順になっていますが、日付順、題名順...等々、状況に応じて使い分けられます。 2
最後に対象となるインデックスファイルを選びましょう。ここでは、3つのインデックスファイルがありますが、一つの場合は選ぶ必要がありません。

※1: AND検索の場合は、検索式をスペースで省略する事ができます。この場合は、「NAMAZU and メーリングリスト」とするところが「NAMAZU メーリングリスト」と省略されています。
※2: この場合はあくまで検索例です。お使いになる設定次第で、お好きなようにカスタマイズすることができます。


■検索式一覧
検索方法 説明
単一単語検索 調べたい単語を一つ指定するだけのもっとも基本的な検索手法です。 Namazu
AND検索 ある単語とある単語両方を含む文書を検索します。3つ以上の単語を指定することも可能です。単語と単語の間に and を挿みます。(and は省略できます。単語を空白で区切って羅列するとそれらの語すべてを含む文書をAND検索します。) Namazu and Unix
Namazu Unix
OR検索 ある単語とある単語のどちらかを含む文書を検索します。3つ以上の単語を指定することも可能です。単語と単語の間に or を挿みます。 Linux or FreeBSD
NOT検索 ある単語を含み、ある単語を含まない文書を検索します。3つ以上の単語を指定することも可能です。単語と単語の間に not を挿みます。 Linux not UNIX
グループ化 AND検索、OR検索、NOT検索を括弧でグループ化できます。括弧の両隣には空白を入れる必要があります。 ( Namazu or Unix ) and Mail not Web
フレイズ検索 2語以上からなる複合語を検索します。 "単語" と2重引用符で、あるいは {単語} と中括弧で囲みます。Namazuのフレイズ検索は精度が 100 % ではないため、ときどき誤ることがあります。 "GNU Emacs"
{GNU Emacs}
前方一致検索 ある単語から始まる単語を含む文書を検索します。 inter*
(interから始まる単語)
中間一致検索 ある単語を内包する単語を含む文書を検索します *text*
(text を内包する単語)
後方一致検索 ある単語で終わる単語を含む文書を検索します。 *net
(net で終わる単語)
正規表現検索 検索するキーワードを正規表現で指定します。正規表現は /単語/ のようにスラッシュ記号で囲みます。正規表現の書式はPerlとほぼ同じです。 /インター?フェ[イー]ス/
フィールド指定
の検索
Subject:, From:, Message-Id: といったフィールドを指定して検索する手法です。特にMail/News のファイルを扱う際に効果を発揮します。 +subject:"GNU Emacs"
(Subject:に
GNU Emacsが含まれる文書)


+from:foo@bar.jp
(From:に
foo@bar.jpが含まれる文書)

■いずれの検索方法でもアルファベットの大文字・小文字の区別はしません。
■全角文字の英数字と記号の一部分(ASCIIと重複しているもの)は、半角文字として処理されます。
■「TCP/IP」のような記号を含む語の検索ができます。
 ただし、処理上の問題から TCP and IP のように分割してAND検索をかけた方が高精度の検索が行えます。
 (その分、余計なファイルがヒットしてしまう可能性は高まります)
■and, or, not を単語として検索したいときはそれぞれ、 "and" と2重引用符か中括弧で囲みます。




Page up






[PR]

自費出版印刷| 携帯電話買取| 携帯買取| iphone 修理| 二次会 景品


セキュリティ/メーリングリスト/全文検索 追加オプションサービス