TOP情報セキュリティ> 有効なスパムフィルタとは
スパムフィルタ
今時のスパムフィルタの選定基準

第2回:コラボレーション型スパムフィルタの仕組み

著者:センドメール  小島 國照   2006/11/27
1   2  3  次のページ
有効なスパムフィルタとは

   第1回ではスパムフィルタの選択を誤ると、メールシステム管理者負担の急増につながることを説明し、スパムフィルタに求められる要件を考察しました。スパムフィルタに求められる要件をここに、再度示します。
  • 多言語対応
  • 最小限の管理者への負担
  • 検知率は高く、誤検知率は低い

表1:スパムフィルタに求められる要件(再掲)

   スパムの数は今後さらに増加することが予想されます。そうした状況に対応するには、最低限の管理工数で、自動的にスパムの検知率が向上するようなスパムフィルタが必要です。そこで今、注目されているのがWeb 2.0型とも呼ばれるコラボレーション型スパムフィルタです。


Web 2.0型のスパムフィルタ

   チューニングが必要ないのに優れた精度でスパム検知を行うスパムフィルタとして、注目されているのがCloudmarkです。なぜ、チューニングせずに高い検知率でスパム判定ができるのでしょうか。

   Cloudmarkは「Web 2.0型のスパムフィルタ」と呼ばれています。実は、この呼び名に高い精度誇る検知率の秘密があります。


Web 2.0の基本原理

   Web 2.0は、O’Reilly社のTim O’Reillyが提唱したコンセプトです。その後、様々な定義や解釈がでていますが、Web 1.0とWeb 2.0の違いを簡単に理解するには、百科事典の老舗である「Britannica」とWeb上の百科事典である「Wikipedia」の比較を例にするとわかりやすいでしょう。

   Britannicaは、出版社が著者を雇って記事を書き、百科事典として販売します。それに対してWikipediaでは、読者の一部が著者となって記事を公開し、その記述に間違いを見つけた読者が訂正することによって、百科事典を作成していきます。

   Wikipediaは読者が自由に記述/訂正できるため、多くの人が参加するほど記事が充実しますし、内容の精度も上がっていきます。今ではWikipediaのほうがBritannicaより精度の高い百科事典だという人もいます。

   つまり、Web 2.0の基本原理とは「利用する人が増えていくほど、それにあわせて自動的かつ品質の高いサービスを提供することができる」ということです。


コラボレーション型スパムフィルタとは何か

   Tim O’ReillyはWeb 2.0を定義した記事「What is Web 2.0」でCloudmarkのスパムフィルタの優位性を述べています。Cloudmarkのような「コラボレーション型スパムフィルタ」は、ユーザコミュニティの判断と協力関係をベースとして、スパムフィルタを更新していくので、従来型の電子メール本体を分析するフィルタよりも圧倒的な正確さを提供できるのです。

   つまり、Web 1.0と呼ばれるべき「ベイジアンフィルタ」「キーワードフィルタ」「ヒューリスティックフィルタ」「ロジスティック回帰」などの手法に対して、「コラボレーション型スパムフィルタ」がWeb 2.0型として期待されているのです。それが、Cloudmarkのスパムフィルタです。

   センドメール社が提供するメール統合プラットフォームSendmail Mailstream Managerでは、Cloudmarkをエンジンにしたスパムフィルタリングを実現しています。以降の説明では、Sendmail Mailstream Managerと組み合わせたCloudmarkの機能を「Sendmail/Cloudmarkフィルタ」と呼びます。

1   2  3  次のページ


センドメール株式会社  小島 國照
著者プロフィール
センドメール株式会社  小島 國照
センドメール株式会社社長
日本タンデムコンピューターズ(現:日本HP)、ストラタスコンピュータ(現:日本ストラタステクノロジー)においてマーケティングおよび技術部門の責任者を勤めた後、サイベース、シャイアンソフトウェア、オブジェクト・デザイン・ジャパンなど、ソフトウェア業界において、マーケティング、製品開発、経営などに携わる。2003年より現職。Sendmail,Inc.入社以前は、ターボリナックスジャパン社長として、日本のビジネス市場における本格的なLinux導入に尽力した。


INDEX
第2回:コラボレーション型スパムフィルタの仕組み
有効なスパムフィルタとは
  コラボレーション型スパムフィルタの仕組み
  チューニングの落とし穴