2010年7月1日 星期四

Synology DS409+ 硬碟更換記

收到一封 Synology DS409+ 寄來的一封信 "XXX的本機硬碟4已毀損,請置換新硬碟。" 不會吧, 才用一年多就有一顆硬碟掛掉? 趕緊連線至 web 管理介面, 果然有一顆硬碟顯示未連接, 那不就有可能是電源或是傳輸線的問題嗎? 還是不相信硬碟有這麼容易故障, 那顆可是死雞的 500 G 硬碟也, 之前雞瘟的時候還特別留意有沒有中獎, 型號是 ST3500418AS, 還好沒有, 可是還是讓我心跳了一下! 千萬不要給我連續爆啊, 雖然有三顆 RAID 5 加一顆 hot spare, 可也經不起連續的轟炸啊!

好吧, 問題來了, 要怎麼換硬碟? 直接換上就好了嗎? 不要太衝動, 還是先谷歌一下好了? 發現原來 DS409+ 是用 mdadm 做出來的 RAID. SSH 連線, 先 df -h

Filesystem Size Used Available Use% Mounted on
/dev/md0 2.3G 421.1M 1.9G 18% /
/tmp 252.0M 14.5M 237.6M 6% /tmp
/dev/md2 911.0G 400.0G 510.9G 44% /volume1
/volume1/@optware 911.0G 400.0G 510.9G 44% /opt

再來 mdadm --detail /dev/md0

/dev/md0:
Version : 00.90
Creation Time : Fri Jan 30 10:16:38 2004
Raid Level : raid1
Array Size : 2489920 (2.37 GiB 2.55 GB)
Used Dev Size : 2489920 (2.37 GiB 2.55 GB)
Raid Devices : 4
Total Devices : 4
Preferred Minor : 0
Persistence : Superblock is persistent

Update Time : Thu Jul 1 17:54:43 2010
State : active, degraded
Active Devices : 3
Working Devices : 3
Failed Devices : 1
Spare Devices : 0

UUID : ab1840d1:08eb1608:578f8f46:aeede710
Events : 0.3123

Number Major Minor RaidDevice State
0 8 1 0 active sync /dev/sda1
1 8 17 1 active sync /dev/sdb1
2 8 33 2 active sync /dev/hdc1
3 0 0 3 removed

4 8 49 - faulty spare /dev/sdd1

果然第4顆有問題, 再來 cat /proc/mdstat

Personalities : [linear] [raid0] [raid1] [raid6] [raid5] [raid4]
md2 : active raid5 sda3[0] sdb3[1] sdc3[2] sdd3[3](S)
970486400 blocks level 5, 64k chunk, algorithm 2 [3/3] [UUU]

md1 : active raid1 sda2[0] sdb2[1] sdc2[2] sdd2[4](F)
522048 blocks [4/3] [UUU_]

md0 : active raid1 sda1[0] sdb1[1] sdc1[2] sdd1[4](F)
2489920 blocks [4/3] [UUU_]

unused devices:

這就看不太懂了. 沒關係, 那就換一顆吧? 正疑惑間, 可是這顆真的壞了嗎? 拔下來接到其他台電腦, 疑? BIOS 抓的到啊, 進作業系統, ㄟ? 分割區也抓的到啊, 看起來這顆沒問題啊?? 那把原來這顆接回去? 還是直接換新的? 不管了先把這顆接回去, 電源按下去, 恩, 開機有點久, 4顆硬碟燈怎麼還沒亮? 緊張緊張刺激刺激, 不要全掛啊! 呼, 硬碟燈終於亮了, 結果第4顆還是亮橘燈. 先看看東西還在不在, 好險都還在. 看一下 message

kernel: end_request: I/O error, dev sdd, sector 14143
kernel: raid1: Disk failure on sdd1, disabling device.
kernel: ^IOperation continuing on 3 devices
kernel: end_request: I/O error, dev sdd, sector 16703
kernel: end_request: I/O error, dev sdd, sector 16959
kernel: end_request: I/O error, dev sdd, sector 17215
kernel: end_request: I/O error, dev sdd, sector 17343
kernel: end_request: I/O error, dev sdd, sector 17471
kernel: end_request: I/O error, dev sdd, sector 17727
kernel: end_request: I/O error, dev sdd, sector 17983
kernel: end_request: I/O error, dev sdd, sector 18239
kernel: end_request: I/O error, dev sdd, sector 18367
kernel: end_request: I/O error, dev sdd, sector 19647

看來是硬碟有壞軌, 好吧, 換一顆. 換好後, 電源按下去, 恩, 開機有點久, 4顆硬碟燈怎麼還沒亮? 緊張緊張刺激刺激, 呼, 硬碟燈終於亮了, 第4顆也終於亮黃燈了, 可是 RAID 會自動重建嗎? 進系統看 mdadm --detail /dev/md0

/dev/md0:
Version : 00.90
Creation Time : Fri Jan 30 10:16:38 2004
Raid Level : raid1
Array Size : 2489920 (2.37 GiB 2.55 GB)
Used Dev Size : 2489920 (2.37 GiB 2.55 GB)
Raid Devices : 4
Total Devices : 3
Preferred Minor : 0
Persistence : Superblock is persistent

Update Time : Thu Jul 1 18:56:28 2010
State : clean, degraded
Active Devices : 3
Working Devices : 3
Failed Devices : 0
Spare Devices : 0

UUID : ab1840d1:08eb1608:578f8f46:aeede710
Events : 0.3868

Number Major Minor RaidDevice State
0 8 1 0 active sync /dev/sda1
1 8 17 1 active sync /dev/sdb1
2 8 33 2 active sync /dev/hdc1
3 0 0 3 removed

看來沒有自動重建? 連線到 web 管理介面, 看來要手動重建 RAID


轉換按下去, 只能選第四個

選擇硬碟

重建中......

看一下指令 cat /proc/mdstat

Personalities : [linear] [raid0] [raid1] [raid6] [raid5] [raid4]
md2 : active raid5 sdd3[3](S) sda3[0] sdb3[1] sdc3[2]
970486400 blocks level 5, 64k chunk, algorithm 2 [3/3] [UUU]

md1 : active raid1 sdd2[4] sda2[0] sdb2[1] sdc2[2]
522048 blocks [4/3] [UUU_]
resync=DELAYED

md0 : active raid1 sdd1[4] sda1[0] sdb1[1] sdc1[2]
2489920 blocks [4/3] [UUU_]
[=======>.............] recovery = 38.1% (949440/2489920) finish=0.2min speed=86312K/sec

unused devices:

有 recovery 也, 真感動. 重建好後 cat /proc/mdstat

Personalities : [linear] [raid0] [raid1] [raid6] [raid5] [raid4]
md2 : active raid5 sdd3[3](S) sda3[0] sdb3[1] sdc3[2]
970486400 blocks level 5, 64k chunk, algorithm 2 [3/3] [UUU]

md1 : active raid1 sdd2[3] sda2[0] sdb2[1] sdc2[2]
522048 blocks [4/4] [UUUU]

md0 : active raid1 sdd1[3] sda1[0] sdb1[1] sdc1[2]
2489920 blocks [4/4] [UUUU]

unused devices:

原來那些 UUU 代表的是使用中的硬碟啊. 不過終於搞定了, 呼.

沒有留言:

張貼留言