title_parttitle_parttitle_part
静岡県浜松市であれこれソフトを開発している A.K.I Software のブログです。日々の開発日記やサーバー・セキュリティ関連の話題なども掲載。
<< 2024/04 >>123456789101112131415161718192021222324252627282930
《《《 ネットワーク機器の購入は Amazon で! 》》》
Powered by BLOM ベイジアンspamフィルタの改良Memo
小さくも大きくも閉じたりもしません
07/11/05 01:48 / PMailServer2

1)PMail Server内蔵のベイジアンフィルタは文字列分解の際にその文字列がどの文字体系(ひらがな/カタカナ/漢字/記号/数値/ASCII)をチェックしていますので、それを利用します。

2)文字体系は以下の通りにグループ分けを行います。
a)ひらがな/カタカナ/漢字
b)記号/数値
c)ASCII

3)文字列抽出の際にグループaが存在した場合は無条件に日本語タイプとして判断。
グループaが含まれない場合は、英語タイプとして判断。

4)メールヘッダに含まれる Content-type は判定材料としては利用しない。(spamメールはここすら偽装している場合がある為)

5)ベイジアンフィルタは、日本語タイプとそれ以外(英語タイプ)の2種類にデータベースを分け、文字体系によって参照するデータベースを切り替えることとします。

日本国内の場合、日本語spamとそれ以外(主に英語)spamが送信されてきますが、個別にデータベースを持つことにより従来よりもより効果の高いフィルタリングが見込めます。

[更新日付:2007/11/05 01:48:08]
トラックバックを見る(0)
Log Link [https://akisoftware.com/cgi-bin/blom.exe?akisoft+sl+cc5e39d7948b626074c4c3a694aad63a38bc4466]
TB Link [https://akisoftware.com/cgi-bin/blom.exe?akisoft+tb+cc5e39d7948b626074c4c3a694aad63a38bc4466]

記事へのコメント

コメントはありません

名前
コメントキー
 
コメントする時はキーを正確に入力して下さい
コメント
アドレスを含んだコメントはできません
© 2008-10 A.K.I Software all rights reserved.