どう復旧すると良いか。ATA error countの増加 というログを見て HDD 交換するも、劣化したまま、Degraded の状態。
- 新着としてマーク
- ブックマーク
- 購読
- RSS フィードを購読する
- ハイライト
- 印刷
- 不適切なコンテンツを報告
どう復旧すると良いか。ATA error countの増加 というログを見て HDD 交換するも、劣化したまま、Degraded の状態。
■ 環境
- モデル / ReadyNAS 104
- ファームウェア / 6.10.4 Hotfix 1
- HDD / WDC WD40EZRX
- RAID / RAID 1(Slot1+Slot2) 同じHDD 2台
■ 症状
長年つかっておりますが、数日前に
ディスク: ATA error countの増加を検出しました: [61] ディスク 1(Internal)[WDC WD40EZRX-00XXXXX、WD-WCC4XXXXXXXX] 過去30日間で 12 回。 これは不具合が起こる可能性を示しています。 データ冗長性を維持するために、このディスクを交換する準備をしてください。
というログが数分おきに書き出されるようになりました。
気づくのが遅れたので「過去30日間で 409 回」まで数日間ログを吐き出し続けていました。
ReadyNAS 104 購入時に、同時にハードディスクを計4台買って、2台で RAID 1 を組んでいたので、2台が未使用・未開封で残っています。
そこで、Slot1 の HDD を取り出し、新品と交換。自動的に RAID を再構築されたように見えます。
しかし、管理画面の[システム]-[概要]を見ると状態が「Degraded」と黄色い●が付いています。
本体の表示も「DEGRADED」が点滅し続けています。
これは、どのような状態で、どのような対応をするのが良いでしょうか?
さすがにデータが飛んでしまうのはダメージが大きすぎるので早めに対応を取りたいです。
しかし、色々と調べたのですが、今がどういう状態なのかもよくわかっておりません。
ブラウザやWindowsなどからファイルアクセスして、ファイルの読み出しはできてるように見えます。
書き込みは怖いので行っていません。全データが問題ないかは不明ですが、大丈夫な感じしてます。
■ ログ(表記は上が古い、下が新しい)
ディスク交換直後のログは以下です。
ボリューム: ボリューム data の再構築が開始しました。 ボリューム: ボリューム data のresyncが完了しました。ただし、ボリュームは劣化したままです。 ディスク: チャンネル 1 (Internal) に接続されたディスクのステータスが RESYNC から ONLINE に変更されました。
管理画面と本体の表示は「Degraded」のまま。
待てば変わるのかと思って半日、様子を見たけど変化がないので試しに再起動を行いました。
システム: システムはシャットダウン中です。 ボリューム: ボリューム data は Degradedです。 ボリューム: ボリューム data の再構築が開始しました。 ディスク: チャンネル 2 (Internal) に接続されたディスクのステータスが RESYNC から ONLINE に変更されました。 ボリューム: ボリューム data のresyncが完了しました。ただし、ボリュームは劣化したままです。 ディスク: チャンネル 1 (Internal) に接続されたディスクのステータスが RESYNC から ONLINE に変更されました。
というログ表示がされ、状況は変わりません。
■ ボリュームの状況
管理画面の[ボリューム]を見ると、SATA 4TB の HDDイメージ 2台が本体に刺さっていて、HDD のライトは緑色になっています。(交換した直後は、1台黄色)
左の円グラフには「ボリュームは劣化しています」と書かれています。
この円グラフがよくわからないのですが、グラフは1つしかなく、Slot1 と Slot2 のどちらがボリューム劣化してるのか不明です。
「Slot1 と Slot2 のデータ内容が違う」という意味だと理解してますが…
■ 予測?
Slot1 の HDD を新品に交換したので、Slot2 にはデータが残っていると思っています。
「Slot1 の 新HDD にコピーして RAID1 を再構築しようとしたが失敗した」と理解してるのですが、合ってますでしょうか?
試しに Slot2 の HDD1台だけ刺して起動してみたのですが、NASがうまく起動しなかったのか、管理画面にも、IPアドレスでディスクアクセスしようとしてもつながりませんでした。
不安になったので、Slot1 に 新HDD を刺し直して電源を入れた所、上記の状態に戻って今に至ります。
これはHDDではなく、本体の Slot1 が壊れてるということでしょうか?
これならば1番理解しやすいのですが…
■ 対応
とりあえず、データの保全を最優先としたいです。
まったく同じ HDD が新品未開封で残っているので、X-RAID を OFF にして、Slot3 に刺し、バックアップを取るのもアリかなと思ってます。
(やり方が不明なので不安あり)
その前に、Slot1 が壊れたという判断で、Slot 1 の HDD を Slot 3 に差し替えてみる手も考えられます。
(Slot2 と Slot3 で RAID1 運用できるのかわかりません)
実はそもそも、Slot2 の HDD にデータが残っているのかも確証がありません。
行った作業から Slot2 にはデータがあるはずなのですが、Degraded が Slot1 と Slot2 のどちらのことを言ってるのかよくわからないのです。
手元には
- HDD1:旧Slot1 壊れた?壊れる可能性ある?
- HDD2:旧Slot2 何もいじっていない、データはここに保存されてる?
- HDD3:新Slot1 状況不明、どうなってる?いきなり壊れた?
- HDD4:新品未開封
という4台の HDD がございます。(必要なら買い足し可能)
理想としては今までと同じように Slot1 と Slot2 を使って RAID1 が作れるならベストです。
SSH アクセスして、何かコマンドを打ってみるくらいなら対応できます。
このような状況なのですが、どのような対処をすると良いか、どなたかアイデアがありましたら何かご助言いただけると助かります。