Bulkfeeds Similarity Search リリース

blog.bulknews.net: Bulkfeeds: Similarity Search リリース
わかりやすく言うと、「おとなり Blog」とか呼ばれるようなものです。Blog エントリに含まれる文章を形態素解析し、特徴的単語を抜き出して、それらの単語で Bulkfeeds の RSS Item 全文検索します。結果、話題の関連性が高いエントリが検索できます。
またウェブログ関連のサービスで面白いものが登場しました。Bulkfeeds: Similarity Searchがそれなんですが、Bulkfeedsで収集している各サイトのRSSをもとにそのRSSに含まれる特徴的キーワードを抜き出し、集計して、そのキーワードが関連付くエントリー、似たような内容のエントリーをリンクさせてみる、っていうような機能を提供してくれます。

自分の書いたエントリーに含まれるキーワードを検索キーにして、他の人が書いたエントリーで同じキーワードが含まれるものを検索してくれるってわけですね。その情報の機能としては、トラックバックで同じような内容のエントリー同士をリンクで繋いでいたものが、RSSを利用することで自動でそのリンクを作ってみようって感じだと思います。

また、Bulkfeedsではエントリーごとに対応した検索結果をJavaScriptを利用した呼び出しで個々にページに貼り付けることが出来ます。タイトルだけのリンク一覧出力も可能ですし、本文の冒頭を抜き出したコメント風一覧での出力も可能になっています。

で、早速、エントリーHTMLの右側(今までは空白になっていた場所です)にハンチングの各エントリーに対応した検索結果をコメント一覧風に出力、貼り付けてみました。思った以上にキーワードによる関連リンク精度が高いことにビックリしましたよ。トラックバックだと「自分が知ってるからトラックバック送れる」って言うのが前提にありますけど、この機能を使うことで「自分が書いたエントリーに関連するページを教えてくれる」という、一種、立場の逆転的な情報共有が新鮮かもしれませんね。

それから1つ、注意点というか活用する為にちょっと工夫したい点があります。Bulkfeedsでキーワード抽出対象とする本文範囲はあくまでRSSで「description」として出力している文章部分に限られています。ですので、エントリーを作成する際に編集で「excerpt」を簡単な文章で作成しているような場合は、その簡単な文章のみ特徴的キーワード抽出内容となってしまい、その部分に本当にエントリーの内容として含みたい単語やメッセージが抜けていると、このキーワードの同士の連携がうまく行われず、いまいちピントがずれた検索結果のエントリーしか引けなくなってしまうという可能性があります。

ちょっとした気配りかもしれませんが、excerptにはエントリー内容を簡単に、かつ、的確に伝えられるような短い文章・キーワードを入れておいてあげると、Similarity Searchの精度アップ、関連情報収集の効率アップへと繋がり、今まで以上にRSSの本領が発揮されてウェブログの可能性がさらに広がるんじゃないかと思いますよ。