ファイルサーバHDD障害対応

仕事にいこうとして中断した作業でしたが、だんだん不安になってきたので今日は仕事行かずに自宅サーバを復旧させることにしました。

まずHDDをチェックしてみます。
しかし、S.M.A.R.T.が入ってないです。

# smartctl
-bash: smartctl: command not found

webminから入れます。

smartで検索

smartmontoolsを選択してinstallボタンクリック

インストール失敗

ミラーが見つからないといってます。

いろいろ探るのは次回以降にするとしてrpmを直接取ってきて入れることにします。

# wget http://rsync.atworks.co.jp/centos/5.7/os/x86_64/CentOS/smartmontools-5.38-2.el5.x86_64.rpm
--2011-12-11 14:50:10-- http://rsync.atworks.co.jp/centos/5.7/os/x86_64/CentOS/smartmontools-5.38-2.el5.x86_64.rpm
rsync.atworks.co.jp をDNSに問いあわせています... 失敗しました: 名前解決時の一時的な失敗.
wget: ホストアドレス `rsync.atworks.co.jp' を解決できませんでした。

サーバにアクセスできないエラーがでました。
ブラウザからは表示できたのでおかしい。

# ping yahoo.jp
ping: unknown host yahoo.jp

yahooにもpingできないです。
以前にも同じようなことがあったような。

省エネファイルサーバ構築 24 CentOS 5.6 samba インストールしようとするけどネットワークエラー
省エネファイルサーバ構築 23 CentOS 5.6 ブート時にeth0が起動できない
省エネファイルサーバ構築 20 CentOS 5.6 Aterm WR8700で固定IP設定

読み返してみるとここで問題になってたことは解決してるっぽいです。

よくわからないのでnetworkを再起動してみます。

# service network restart
インターフェース eth0 を終了中: [ OK ]
ループバックインターフェースを終了中 [ OK ]
ループバックインターフェイスを呼び込み中 [ OK ]
インターフェース eth0 を活性化中:
eth0 のIP情報を検出中...mktemp: cannot create temp file /tmp/iI3873: Read-only file system
/sbin/dhclient-script: line 57: $rscf: ambiguous redirect
/sbin/dhclient-script: line 69: $rscf: ambiguous redirect
完了。
mktemp: cannot create temp file /tmp/Ae3917: Read-only file system
./network-functions: line 270: $rsctmp: ambiguous redirect
./network-functions: line 271: $rsctmp: ambiguous redirect
[ OK ]

tmpに書き込めないからエラーとかいってます。
そうか、tmpも今回問題になってるHDDに移動しているから!

ではこれもHDD問題が解決すればなおるはず!

ということでrpmはwindowsで取ってきて WinSCP で /root におきました。

# rpm -ivh smartmontools-5.38-2.el5.x86_64.rpm
エラー: 依存性の欠如:
mailx は smartmontools-5.38-2.el5.x86_64 に必要とされています

mailx がないといわれたので同様にとってきます。

# rpm -ivh mailx-8.1.1-44.2.2.x86_64.rpm
準備中... ########################################### [100%]
1:mailx ########################################### [100%]

入りました・・・。

# rpm -ivh smartmontools-5.38-2.el5.x86_64.rpm
準備中... ########################################### [100%]
1:smartmontools ########################################### [100%]

入りました・・・。

ではやってみます。

# smartctl -t short /dev/sdb
smartctl version 5.38 [x86_64-redhat-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Short self-test routine immediately in off-line mode".
Drive command "Execute SMART Short self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 2 minutes for test to complete.
Test will complete after Sun Dec 11 15:52:51 2011
Use smartctl -X to abort test.

2分かかるので15:52:51までまてと。
その間に洗い物をしてくる。

# date
2011年 12月 11日 日曜日 15:55:51 JST

だいぶ過ぎました。確認してみる。

# smartctl -l selftest /dev/sdb
smartctl version 5.38 [x86_64-redhat-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 11051 -

エラーなし!!!

わからない・・・。
再起動ではなく起動した状態でマウントしなおしたらどうなるのだろう?

Mount now? を Unmount にして Save
Unmountできないので強制的にやる?というのでや Force UnMount

UnMountされてる風の一覧

Mount しなおしてみる
もうMountされてるのでエラー

ということで再マウントできなくなりました。
また再起動

#reboot

シンボリックリンクで/tmpや/logを移動しているのがいけないんじゃないか?という気がしてきたのでこいつらをシンボリックリンクじゃなくてマウントするようにしたらどうなんだろう?
と思ったのでやってみます。

がおなかがすいたので中断。

コメント