title_parttitle_parttitle_part
静岡県浜松市であれこれソフトを開発している A.K.I Software のブログです。日々の開発日記やサーバー・セキュリティ関連の話題なども掲載。
<< 2024/04 >>123456789101112131415161718192021222324252627282930
《《《 ネットワーク機器の購入は Amazon で! 》》》
2007/09/25 BLOM正式版リリース!
BLOM のダウンロードは こちらからどうぞ。

Powered by BLOM 更新Pingサーバを作る その2
小さくも大きくも閉じたりもしません
08/02/19 05:34 / BLOM

キャッシュの仕様も決まって実際に稼働テストの段階に入りました。(更新Pingの送信先は内緒です)

photo

xmlrpc.WeblogUpdates.ping を受け取るCGIがクロールサーバ用にキューを出力します。
クロールサーバは、Que に従ってトップページに <LINK> で RSS/XML の URL が指定されている場合に、その URL を使ってRSSフィードの取得を行います。RSS1.0/2.0 に対応しており(ATOMはスルー)RSSフィードが EUC で書かれている場合もきちんと変換を行います。取得は2段階で制限されており、始めてそのサイトを巡回した場合は現在からX日以内のフィードの取得を行い、2回目以降は、Y日以内のフィードのみ取得を行います。
また、上記とは別に同一URLへの巡回はZ時間以上経過していなければクロールは行いません。
連続して更新Pingを送信してもスルーさせる為です。
changes.xml も出力します。

photo

キャッシュデータは、取得したRSSフィードの Description を加工して記録されます。Windowsっぽく Shift-JIS に変換もします。
相変わらずSQL等は使いたくないので(でも、本当はこういう目的こそSQL等使って処理する必要があるんです。が、うちの場合はCGIからコールできるの専用テキストDBがゴリゴリと稼働していますので)テキストで出力されます。
このキャッシュデータに対して検索用CGIを動かせば、ブログ検索の出来上がりです。実質(XML解析のベース部分を除いて)2,3日で作った割にはかなりまともに動きそうです。

おまけ。
photo

ちゃんと説明も付きました。

[更新日付:2008/02/19 05:34:41]
トラックバックを見る(0)
Log Link [https://akisoftware.com/cgi-bin/blom.exe?akisoft+sl+cc7f01ba4b48f20e385e37b0aa575c38bac0b21e]
TB Link [https://akisoftware.com/cgi-bin/blom.exe?akisoft+tb+cc7f01ba4b48f20e385e37b0aa575c38bac0b21e]

記事へのコメント

コメントはありません

名前
コメントキー
 
コメントする時はキーを正確に入力して下さい
コメント
アドレスを含んだコメントはできません
© 2008-10 A.K.I Software all rights reserved.