朝顔日記

POPFile を導入してみた

2004-02-26

話題の orkut のご招待メールが spam と間違われて読まれていないのでは、みたいな話しからどうやって spam 対策をするかみたいな話しに転じて、その過程で知ったのが、POPFile というツールです。最近1日あたり何十通もいわゆる spam が来て困っていたのでさっそく導入してみました。メーラーを、高性能なジャンクメールフィルターを装備する Thunderbird あたりへ乗り換えようかと考えていたので、渡りに船でした。

POPFile というのは、ローカルで動く POP のプロキシです。これを導入すると、これまではメーラーが直接 POP サーバへメールを取りに行っていたのが、POPFile を経由してメールを取ってくるようになります。つまり、実際にメールを取りに行くのは POPFile ということになります。POPFileには、ベイズ推定というよくわからない何かを使って、メールを振り分ける(分類する)機能があります。この機能を使って spam メールになんらかのをつけてやるわけです。

このとき分類の規則を自分で定義する必要はありません。しばらくの間、web ベースのインターフェースを持つ POPFile のコントロールセンターを使って、このメールはこういう種類のメールだよと、手動で分類してやります。すると、POPFile はそれを学習してしばらくすると、ほぼ間違いなく自動的にメールを分類してくれるようになるという仕組みのようです。最初は間違った分類をしますが、間違いを正してやるとそれを学習してくれるという賢さです。:-)

いろいろ高度なことも出来るらしいのですが、私の場合は spam とそうでないメールが区別がつけばいいので、バケツと呼ばれる分類を2つ作りました。ひとつは spam 用、もうひとつはその他ということで、other というものです。これで、POPFile 経由で入ってくるメールで、spam に分類されるものは、メールのヘッダに、X-Text-Classification: spam が付加されて来ます。これを自分の使っているメーラーの振り分け機能を使って好きなようにすればよいという仕組みです。

以下は、POPFile のコントロールパネルの履歴のスクリーンショットのサムネイルです。この画面で、POPFile が受け取ったメールをどのように分類したかを確認したり、間違いを正してやったりすることが出来ます。例によってフルサイズの画像(約19KB)にリンクしてあります。

まだ導入したばかりなのでどのくらいの判定精度まで上がるかわかりませんが、今日半日だけでも、かなり学習したようで明日以降が楽しみです。POPFile なしのときに比べて受信に少し時間がかかる点を除けばいい感じです。つか、別マシンで使っている Edmax フリー版と比べても常用している電信8号の受信が非常に高速なので余計そう感じるのかもしれませんが。

「POPFile を導入してみた」へコメントをつける

書き込み時の挙動について
URI らしき文字列には自動的にリンクが張られます。また "<" や、">" は実体参照化されます。
スパム対策のため、リファラを切っていると投稿できません。

この記事の永続的 URI ならびに トラックバック ping URI
http://diary.noasobi.net/2004/02/diary_040226a.html