Доброго времени.
Такая проблема, с которой отродясь не сталкивался: при каждой перезагрузке стабильно выкидывает 1 элемент из /dev/md2 (используется под корень), при том что остальные массивы живы-здоровы. Система Centos 6.5 чистая, свежая, только что установленная.
Конфигурация такая:
------------
md2 : active raid1 sda2[0] sdb2[2] sdc2[1]
5118912 blocks [3/3] [UUU]md3 : active raid5 sdc3[2] sda3[0] sdb3[1]
299187712 blocks level 5, 256k chunk, algorithm 2 [3/3] [UUU]
md1 : active raid1 sda1[1] sdc1[0] sdb1[2]
523200 blocks [3/3] [UUU]
md4 : active raid5 sda4[0] sdc4[2] sdb4[1]
2094592 blocks level 5, 256k chunk, algorithm 2 [3/3] [UUU]
------------
md2 - это корень, а например md3 - /var, где идет интенсивное i/o (т.е. были бы проблемы аппаратные, я думаю постоянно вылетал бы и md3).
Причем выкидывает из md2 по очереди, то sda2, то sdc2, то sdb2, в конце концов остается один элемент в массиве.
Например вот, первый ребут:
md2 : active raid1 sdb2[2] sdc2[0]
5118912 blocks [3/2] [U_U]
Второй:
md2 : active raid1 sdc2[0]
5118912 blocks [3/1] [__U]
Добавляю обратно — ребилдит, и то же самое, каждый ребут начинает выкидывать по одному элементу.
Самое главное, в логах ничего интересного нет, только это:
md2: started with 2 of 3 devices.
В конфиге mdadm все массивы описаны, даже пробовал принудительно добавлять devices=... в ARRAY, нифига.
Если сделать mdadm -E на выпавший элемент, он его корректно определяет как принадлежащий к md2, стутус - removed.
Ей богу, всю голову сломал. Помогайте :(