<< 2024/04 >> | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 |
|
Version 1.72 Memo
08/06/17 20:24 / PMailServer2
ベイジアンフィルタの改良を引き続き行っています。
根幹となるアルゴリズムは変わりませんが、HTMLタグ切り出しの精度や、特別な文字列(URLなど)を主に変更しています。 日本語の解析が相変わらず難しいのですが、日本語の場合「意味的に綺麗に切り出す=精度が上がる訳」では無いので悩みどころです。 ベイジアンフィルタは単語(Token)単位の出現率を過去の出現率にあわせて判定を行うのですが、日本語の場合、言い回しってものがあり「言いましたね?」「言いましたネ?」と同じ意味でも切り出し方によっては判定が変わります。 文章を作成する人固有の言い回しや語句の使い方があるので、その特徴?を捉える意味でも現状の方式がいいかな、と思っています・・・が 一応、アルゴリズム自身も少し改良を考えていまして、改良版の実装を行ってみたのですが精度も上がるパターンもあれば下がるパターンもあり悩ましいです。 大量のspamをキープしてありますので、統計を取って良い方を選択したいと思います。 [更新日付:2008/06/17 20:24:27]
トラックバックを見る(0) Log Link [https://akisoftware.com/cgi-bin/blom.exe?akisoft+sl+f972c7e99b6c6d2193a7e983ed7a634542a1f01b] TB Link [https://akisoftware.com/cgi-bin/blom.exe?akisoft+tb+f972c7e99b6c6d2193a7e983ed7a634542a1f01b] 記事へのコメント コメントはありません |
@AKISoftOfficialをフォロー
掲示板 サポートBBS PMailServer BBS アクセスの多い記事
最新記事(カテゴリ別)
PMailServer2 Version 2.53 をリリースしました。
04/08 00:50 フリー版からの製品版移行時の MTA 並列数について 02/17 23:52 メールサーバーの開発を始めて20年 02/07 21:46 PMailServer2 Version 2.52a をリリースしました。 12/26 14:02 PMailServer2 Version 2.52 をリリースしました。 10/01 10:48 PMailServer2 Version 2.51b をリリースしました。 09/19 01:43 PMailServer2 Version 2.51b(仮) Memo 09/12 00:33 PMailServer2 Version 2.51a をリリース、及び脆弱性についてのお知らせ 09/05 01:15 PMailServer2 Version 2.51a Memo 08/21 00:48 アドレスV125(K5)のスターターリレーの交換 08/04 10:10 最新コメント
コメントはありません
UUアクセス数
今日は 429回
昨日は 330回 トータル 305285回 3ヶ月記事別ランキング
プロフィール
Z80から68系、8086系を経由して
Pascalに移行。現在は Delphiをメインに C/C#も囓ってみたり。 「無い物は作れ」の精神で年がら年中なにかを作っています。 すぐ自前で作りたがるので無駄に工数が上がったりして自爆してみたりもします。 好きな物は麺類とお煎餅 Blom内検索
BLOM Version 1.39 ©2007-15 A.K.I Software all rights reserved. |