title_parttitle_parttitle_part
静岡県浜松市であれこれソフトを開発している A.K.I Software のブログです。日々の開発日記やサーバー・セキュリティ関連の話題なども掲載。
<< 2024/04 >>123456789101112131415161718192021222324252627282930
《《《 ネットワーク機器の購入は Amazon で! 》》》
Powered by BLOM サーバクラッシュ!
小さくも大きくも閉じたりもしません
08/07/21 20:47 / 雑談

7月20日の夕方4時ほどに、サーバ上で動かしていたちょっとしたソフトが目の前で強制終了してしまい(たまたま監視していた)

はて?強制終了するなんて珍しい・・・

というのが始まりでした。

帯域の負荷が大きくなったのかなと思い他を確認すると次々とタイムアウトして反応が無くなっていきます。
なにかサーバソフトが暴走しておりCPU負荷が100%になっているのかと思い(開発中にタマにやってしまいます)、うちのサーバはハウジングで預けてありますのでたまたま居た ISPの人(以下中の人)へ頼んでサーバの再起動をして貰います。

暫く待てども再起動してくる気配がありません。
さすがにヤバイと思ったのですが、中の人は既におらず、落ちた時の暫定用サイトに切り替える準備をします。

と言ってもかっこいい切り替え装置がある訳ではなく、別のサーバにダミー用サイトだけ置いてあり、DNS を設定を変更するだけなのですが。
(うちくらいのサイトの場合落ちた時用のサーバ機まで預けておくのはムダですので。)

サーバ機を直接見ないことにはどうしようもありませんので中の人からの連絡待ちをしつつ最悪の自体を想定して予備パーツを物色します。

深夜になり連絡が取れサーバルームへ直行。電源は入っているものの完全にフリーズしています。CPUファンはまわっていますが電源ファンの回転が少し・・・いやかなり遅いです。取りあえず電源を落としてハードディスク等を外しマザーボード上にはCPUのみの状態にします。
この時点でCPUをかなり疑っていました。なぜならば以前にもこのサーバ機はCPUだけが壊れたという器用な壊れ方をしていたからです。
電源を入れるとメモリが未装着のビープ音が鳴りましたのでCPUとマザーボードは無事です。
次にメモリを挿してBIOSの確認をします・・・がBIOS起動しません。まずメモリが逝っているのが確定です。
メモリを予備に差し替えて再起動するとBIOSは動きましたので次はハードディスクを接続。起動ドライブから異音。
壊れたハードディスクの確認したことがある方ならわかると思いますが、カリカリッ・・・カリカリッ・・・とリトライしている悪夢の音です。
これで起動ドライブも逝ったのが確定です。
ハードディスクの予備が切れていたのでここで手出しが出来なくなります。
ハードディスクは朝一で買いに行くとして、取りあえず電源ユニットも交換。ついでに転がっていた強力(しかし五月蠅い)なファンに交換してみます。
photo

えーと・・・奥行きのサイズが合わなかったので無理矢理ネジ止め用のステーを曲げて針金で固定して取り付けました。冷えれば正義です。

次の日。

朝一でハードディスクを購入してOSの再インストール。
データ用のドライブは無事でしたので Web/Mail/FTP/DNSなどもインストールをして動作確認へ。
Web設定はバックアップデータから復旧し、PMail Server はデータドライブに入れてあったのでインストールボタンを押して開始を押すだけ(笑)
FTP もバックアップデータから上書きして戻しました。
DNS バックアップが古く L root サーバ のアドレスが旧アドレスのままでしたのできちんと書き換えます。
サーバソフトは設定を変更した都度こまめにバックアップを取っておくと万が一の時に後悔しません。

復旧の目処が立ったので書き換えた DNS を元に戻して DNS情報が再度浸透するのを待っている状態です。
(この記事を見れていれば浸透していることになります)

今年も猛暑のようですしサーバー管理者の皆様お盆休み等は熱暴走の対策を充分にしておきましょう。

[更新日付:2008/07/21 21:39:37]
トラックバックを見る(0)
Log Link [https://akisoftware.com/cgi-bin/blom.exe?akisoft+sl+30e937802504be15e9a15db336dab4f2bcabd120]
TB Link [https://akisoftware.com/cgi-bin/blom.exe?akisoft+tb+30e937802504be15e9a15db336dab4f2bcabd120]

記事へのコメント

名前 : H.Matsuda (2008/07/29 19:57:49)

PMail Server がインストールされているドライブが飛んでしまった時はリストアしなければなりませんが、今回は起動ドライブ(C)が飛んでしまい、PMail のインストールドライブであった(D)は無事でしたので、OS の再インストール後にサービスの登録と開始を押すだけで復旧できる訳です。また PMail のサーバ部分は pmservice.exe のあるフォルダからの相対パスで動作しますので、ドライブレターが変わったりフォルダ位置が変わってもそのまま動くようになっています。
ただし、サービスとしてのフォルダ位置が OS に記録されていますので、変更になった場合は pmman からサービスのアンインストール後にインストールを行って更新して頂く必要はあります。

http://www.netjapan.co.jp/e/product/storage/SRM/
これいいですね、価格も手ごろですし。
万が一飛んだ時の手間を考えるとこういうのを入れておくと良いのですが、一旦新品にすると暫くは安全だろうとついつい後回しにしてしまったり・・・(そして暫くしてまた同じことを(^-^;

名前 : matsu (2008/07/29 09:46:38)

>冷えれば正義です。

大笑いしました。確かにその通りです。
短時間で復旧できてなによりです。

>PMail Server はデータドライブに入れてあったのでインストールボタンを押して開始を押すだけ(笑)

これは,クラッシュ時まで動作していたPMail Server の設定ファイルはインストール操作で上書きされないから。と考えて良いでしょうか。私も起動ドライブとは別ドライブにインストールしています。

最近,
http://www.netjapan.co.jp/e/product/storage/SRM/
というソフトを見つけ,試してみようかと思っています。

名前 : H.Matsuda (2008/07/24 22:26:33)

Test

名前
コメントキー
 
コメントする時はキーを正確に入力して下さい
コメント
アドレスを含んだコメントはできません
© 2008-10 A.K.I Software all rights reserved.