ベイジアンフィルタ

PMail Server で示すベイジアンフィルタは、ベイズ理論を使った spam フィルターです。要約すると「spam メールに含まれる文字集合と 非spamメールに含まれる文字集合の確率を計算し、spam メールか否かを判断し、結果で更に確率の修正を行っていくフィルタ」です。
文字集合は複数の文字の集まりを指します。「単語」のように意味のある状態にはならないので、このような表現をしています。

ベイズ理論を使った spam フィルタ作成に関しては、下記のページを参考にさせて頂きました。

Paul Graham 氏が書かれた「A Plan for Spam」及び 「Better Bayesian Filtering
Copyright 2002-03 by Paul Graham

上記ページの日本語訳
Shiro Kawai氏が日本語に翻訳された「スパムへの対策」及び 「ベイジアンフィルタの改善

Gary Robinson 氏が書かれた「Spam Detection
Copyright 2004 Gary Robinson.


ベイズ理論やベイジアンフィルタに関しては上記のページや Web 上に多くの説明がありますので、ここでは省略し説明は致しません。
以降は PMail Server に実装されているベイジアンフィルタに関する固有の情報です。(上記理論やベイジアンフィルタの知識が必要となります)

spam と spam フィルタはいたちごっこであり、絶対に spam を受け取りたく無い場合の防衛策はメールを受信しない以外はありえません。ベイジアンフィルタは spam を受け取らない為の補助的な役割に過ぎませんのでご注意下さい。
同じサーバから大量に送られてくるメールに対してはベイジアンフィルタよりも SMTP フィルタで処理を行うのが確実です。