
Exchange Server 2010の日本語メール検索とその問題について
ExchangeブログJAPANにてExchange Server 2010のメール検索についての記事が公開されています。
Exchange 2010 でのメールの検索について – Exchange ブログ JAPAN – Site Home – TechNet Blogs
要は「日本語は扱いが難しいからちゃんと検索できないよ」という事ですね。Exchange Server 2003の時代にはインデックスを作成するかどうかを設定で決めることができました。当時の設計ガイドラインとしては
- インデックスを作成すると検索が早い!でも、きちんとキーワードで検索できないケースも出てきてしまう。さらにインデックスを保持するためのディスク領域も必要になる。
- インデックスを作成しないと、検索に時間はかかるものの、文字列が存在すれが検索できないということはない。必ず検索できるようにするためにはインデックスは無効の方が良い。
というような感じでした。多くの顧客で「検索でヒットしないなんて許されないでしょ」ということでインデックスを作成していなかったものです。
ですが、Excahnge Server 2007以降では「インデックスを作成しない」という選択肢自体が存在しなくなってしまいました。英語など、単語の間にスペースが入る言語であれば「ヒットしない」ということは起きないので大容量化するメールボックスサイズを前にしてインデックスを作成しないなんていうのはありえない選択肢だったのでしょうけれども、日本人には厳しいところですね。
また、記事では「Outlook オンラインモード、および OWA でのメッセージの検索」となっており、Outlookキャッシュモードについての言及がありませんが、Outlookキャッシュモードではクライアントのローカル上で動作するWindows Searchを使って検索します。
Exchange キャッシュ モードでは、Outlook は Windows Search、Windows 7 に組み込まれたコンポーネントおよび Windows Vista を使用します。Windows Search は、コンテンツのインデックス処理を実行して、Outlook に検索機能を提供します。ローカル コンテンツのインデックス処理と検索サービスは、Exchange キャッシュ モードで実行している Outlook ユーザーに、より効率的に彼らのメールボックスを検索する方法を提供します。オフライン ストアで電子メールをインデックス処理することに加えて、Windows Search は、ファイル システムに存在する他のデータもインデックス処理します。Windows Search の詳細については、「Windows Search」を参照してください (このサイトは英語の場合があります)。
Exchange Search について: Exchange 2010 のヘルプ http://technet.microsoft.com/ja-jp/library/bb232132(EXCHG.141).aspx
そして、もちろんWindows Searchであっても、きちんと検索できない問題があります。
IWordBreaker とファイル検索 – NyaRuRuが地球にいたころ
現実的な回避策が無いのが現状ですし、この状況はしばらく(ずっと?)解消されないものと思われます。その他Microsoft製品でも基本的に同じ状況になりますので、この事実はきちんと認識しておくべきです。
インデックスを使わない検索が復活…することはまず無いでしょうね…。
Exchange Serverの検索インデックスに関してはこちらも参考にどうぞ。
Exchange 2007/2010 検索インデックスについて – Exchange ブログ JAPAN – Site Home – TechNet Blogs