The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Пару недель назад в 20 раз упала скорость работы диска WD SATA."
Вариант для распечатки  
Пред. тема | След. тема 
Форум Открытые системы на рабочей станции (Драйверы, оборудование)
Изначальное сообщение [ Отслеживать ]

"Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (0), 20-Апр-23, 13:52 
WDC WD1600JS
Пробег - 48637 часа
Включений питания - 11732 раза
Ошибок чтения - 2 обе на 42234 часу работы
UDMA6

hdparam -tT /dev/sda
скорость показывает нормальную

hdparam -N /dev/sda
HPA нет.

smartctl -a /dev/sda
тесты проходит без ошибок

Проблема:
В GNU/Linux иногда при обращенни к диску появляются сильные тормоза в IO
atop выдаёт длительную 100% загрузку диска. А чем? Невидно!

Перегрузился с LiveCD:

dd if=/dev/urandom of=/dev/sda bs=1M status=progress
Скорость упала уже аж В 20 РАЗ!!! И мне кажется продолжает падать. Кеш забивает быстро, как и было, а на операции записи на диск начинает тормозить.

При записи лампочка работы диска горит дольше (дольше пишет) но характерного шума работы диска нет. Есть мнение, что горение лампочки и тихая работа диска свидетельствуют о проблеме в механики - выходит из строя мотор вращающий блины.

iostat низкая скорость записи на sda.

Может вири?
Проверка AIDE показала только изменения прав в /dev/console с 600 на 622.
Проверить прошивку диска не могу, WD штатных средств не имеет, а в инете потерялась ссылка на патчи для работы с прошивками WD.

Вирус вредит или диск дохнет?

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по времени | RSS]


1. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (1), 20-Апр-23, 18:00 
Выполни лонгтест (smartctl -t long, может быть достаточно более короткого и менее опасного), после этого данные в smartctl -a обновятся. Тестирование должно висеть в кроне, без этого смарт ошибки не найдёт или во всяком случае не все. Кстати, какие-то ошибки после тестирования могут и исчезнуть.

Команда iotop -oa (от рута) может показать, кто жрёт диск. Это может быть фрагментация, деградация файловой системы (XFS, BTRFS), свопинг. Конфигурация ядра или его ошибки. При работе нескольких процессов одновременно, производительность легко может падать в десятки раз. Если говорить конкретно про значение "в 20 раз" то это звучит похоже на то, как работает ripgrep -- в отличие от gnu grep, он пытается читать данные в несколько потоков, что вызывает замедление как раз в 20 раз относительно однопоточного.

Некоторые диски (в частности, современные WD), заявленные как CMR, внезапно прекращают активность и "уходят на подумать" во время активной записи, это занимает несколько секунд, во время которых передача данных останавливается. Для SMR просадки на записи ожидаемое поведение. Можно довольно долго эту особенность не замечать.

По теме, скорее всего диск не жилец. Но я правильно понял, что у него скорость линейного чтения 50мб/с? У современных дисков в районе 300мб/с. Случайное чтение у него тоже около 1мб/с, в норме. Самое время обновиться, рекомендую поменять на SSD.

Ответить | Правка | Наверх | Cообщить модератору

2. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (2), 20-Апр-23, 19:26 
> Выполни лонгтест (smartctl -t long, может быть достаточно более короткого и менее
> опасного), после этого данные в smartctl -a обновятся. Тестирование должно висеть
> в кроне, без этого смарт ошибки не найдёт или во всяком
> случае не все. Кстати, какие-то ошибки после тестирования могут и исчезнуть.

smartctl -t /dev/sda
smartctl -t long /dev/sda
ошибок нет, тест проходит в заявленное время.

smartctl -a /dev/sda
записывает результаты теста в лог только если включен smartd


> Команда iotop -oa (от рута) может показать, кто жрёт диск.

не показывает

> Это может быть фрагментация, деградация файловой системы (XFS, BTRFS), свопинг.

своп иногда может работать но это другое, жрет IO тормозит работу с памятью но не так.

> Конфигурация ядра или его ошибки.

Не менял ядро в этот период.

> При работе нескольких процессов одновременно, производительность легко
> может падать в десятки раз. Если говорить конкретно про значение "в
> 20 раз" то это звучит похоже на то, как работает ripgrep
> -- в отличие от gnu grep, он пытается читать данные в
> несколько потоков, что вызывает замедление как раз в 20 раз относительно
> однопоточного.

Загрузка с LiveCD производительность
dd if=/dev/urandom of=/dev/sda bs=1M status=progress
упала с ~50Mb/s до `2.5Mb/s
dd единственная программа работающая с диском. Перезагрузки с LiveCD тот же результат.

> Некоторые диски (в частности, современные WD), заявленные как CMR, внезапно прекращают
> активность и "уходят на подумать" во время активной записи, это занимает
> несколько секунд, во время которых передача данных останавливается. Для SMR просадки
> на записи ожидаемое поведение. Можно довольно долго эту особенность не замечать.

Но не на 2 минуты уходят

> По теме, скорее всего диск не жилец. Но я правильно понял, что
> у него скорость линейного чтения 50мб/с? У современных дисков в районе
> 300мб/с. Случайное чтение у него тоже около 1мб/с, в норме. Самое
> время обновиться, рекомендую поменять на SSD.

Давно купил другой диск и всё туда перенёс. Но хочу разобратся с поломкой этого.

hdparm -Tt /dev/sda дает нормальную скорость.
dd тормозит
cp только иногда уходит на подумать.

Ответить | Правка | Наверх | Cообщить модератору

3. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (1), 20-Апр-23, 20:24 
Помимо выхода из строя электронной начинки ещё может быть питания не хватает или кабель/соединение повреждены. В Victoria есть скан поверхности, показывает, если какие-то части диска долго отвечают. Припоминаю, что полноценной была та версия, что работала в DOS. Можно попробовать. Если выходит из строя мотор, то, видимо, случайные ошибки будут. Может быть только при активной записи сыпется, в таком случае можно использовать для чтения. А если только какие-то конкретные области, то в линуксе есть badblocks и можно создать фс так, чтобы проблемные области не задейстовались. При желании выжать максимум из железа. Я, правда, слабо представляю, как умирающий диск можно использовать, кроме как под торренты.
Ответить | Правка | Наверх | Cообщить модератору

5. "Наверно вирус злобный подцепил?"  +/
Сообщение от Аноним (5), 21-Апр-23, 17:13 
> Помимо выхода из строя электронной начинки ещё может быть питания не хватает или кабель/соединение повреждены.

Электронная, аппаратная, начинка нормальна, проблем с ней не диагностируется. Кабели сменил.

> В Victoria есть скан поверхности, показывает, если какие-то части диска долго отвечают. Припоминаю, что полноценной была та версия, что  работала в DOS. Можно попробовать.
> Если выходит из строя мотор, то,  видимо, случайные ошибки будут. Может быть только при активной записи сыпется, в таком случае можно использовать для чтения.

Это мнение с инетов. Но это не точно.

> А если только какие-то конкретные области, то в линуксе есть badblocks и можно создать фс так, чтобы проблемные области не задейстовались.

Пробовал
dd if=/dev/urandom of=/dev/sda bs=1M skip=100G status=progress
скорость ~2Mb/s

> При желании выжать максимум из железа. Я, правда, слабо представляю, как умирающий диск можно использовать, кроме как под торренты.

Система на нём была, чтобы по инетах шарится.

Тесты offline: short, conveyance, extended - проходит все БЕЗ ОШИБОК.
В логах:
smartctl -x /dev/sda
есть записана максимальная температура 87C при макс допустимой всего 70
Также параметр 190 Airflow_Temperature_Cel имеет ошибку in_the_pest и показывает правельную температуру как параметр 194 Temperature_Celcius.

Перепрошил БИОС на мамке, не помогло.

Слишали о вирях которые херят винты? Склоняюсь к вирусу. Прошивку фирмвари на WD знает кто как дампануть/перепрошить?

Ответить | Правка | Наверх | Cообщить модератору

6. "Наверно вирус злобный подцепил?"  +/
Сообщение от lavremail (ok), 21-Апр-23, 17:51 
> Перепрошил БИОС на мамке, не помогло.

смысл? :)

> Слишали о вирях которые херят винты? Склоняюсь к вирусу.

какой еще вирус? возьмите любой live-usb linux дистрибутив
и запустите с него dd, вопрос о вирусах портящих hdd снимется

> Прошивку фирмвари на
> WD знает кто как дампануть/перепрошить?

кто ж Вам даст софт?! Тут нужно несколько уровней поддержки
пройти чтобы выйти на технарей да еще и получить софт для
прошивки и firmware на старые модели hdd.
Что и раньше то было ну очень сложно, зная наш саппорт,
а в нынешних условиях спецоперации, просто нереально.

Ответить | Правка | Наверх | Cообщить модератору

10. "Наверно вирус злобный подцепил?"  +/
Сообщение от Аноним (10), 22-Апр-23, 07:19 
>> Перепрошил БИОС на мамке, не помогло.
> смысл? :)

Может вирь в биосе? Не вся область биос флешки при стандартной перепрошивки затерается, в конце флешки область не затеряется.

>> Слишали о вирях которые херят винты? Склоняюсь к вирусу.
> какой еще вирус? возьмите любой live-usb linux дистрибутив и запустите с него dd, вопрос о вирусах портящих hdd снимется

Вирус может быть не только в OS, а и в БИОС/UEFI, прошивках дисков. Для буткитов прошивка диска одно из самых лакомых мест.

Именно так и делал! Гружусь с LiveCD выполняю:
dd if=/dev/urandom of=/dev/sda bs=1M status=progress
и вижу скорость ~2Mb/s

Запускаю аппаратные тесты винта offline: short, conveyance, extended и вижу что проходит все тесты БЕЗ ОШИБОК, и с указанной в документации скоростью!

Чтение с диска нормально проходит, без ошибок. Запись тоже без ошибок но с тормозами IO в 20 раз.

К стати с разных LiveCD грузился и смотрел загрузку IO в iotop при работе dd или sync, в одном LiveCD видна загрузка IO в ядерного процеса [jbd2/dm-3-8]

>> Прошивку фирмвари на WD знает кто как дампануть/перепрошить?
> кто ж Вам даст софт?! Тут нужно несколько уровней поддержки  пройти чтобы выйти на технарей да еще и получить софт для  прошивки и firmware на старые модели hdd. Что и раньше то было ну очень сложно, зная наш саппорт, а в нынешних условиях спецоперации, просто нереально.

Я видел в инетах патчи для изменения прошивок в WD. WD секретит комады для работы с прошивками, но в https://www.smartmontools.org/ они есть и их можно использовать для https://sg.danny.cz/sg/ в которой есть утилиты для дампа и прошивки фирмваре дисков. Лет 5 назад читал подробную статейку о том как изменить прошивку дисков WD, к ней прилагались патчи к sg3_utils для дампа/прошивки WD дисков. Вот эту статейку с патчами ищу. Автор писал что все просто, необходимые команды взял с smartmontools и добавил в sg3_utils.

Ответить | Правка | Наверх | Cообщить модератору

16. "Наверно вирус злобный подцепил?"  +/
Сообщение от Аноним (16), 24-Апр-23, 18:09 
>> Прошивку фирмвари на WD знает кто как дампануть/перепрошить?
> кто ж Вам даст софт?! Тут нужно несколько уровней поддержки пройти чтобы выйти на технарей да еще и получить софт для прошивки и firmware на старые модели hdd. Что и раньше то было ну очень сложно, зная наш саппорт, а в нынешних условиях спецоперации, просто нереально.

https://forum.hddguru.com/viewtopic.php?t=39947

https://support.hpe.com/hpesc/public/docDisplay?docLocale=en...

https://forums.servethehome.com/index.php?threads/updating-t.../

1 способ безопасный:


sg_write_buffer -vvvvv -m 5 --in VKGNW984.bin /dev/sg2

2 способ опасный:

hdparm -y /dev/sdc
hdparm --fwdownload-mode3 ST31000340NS_SN06.lod --yes-i-know-what-i-am-doing --please-destroy-my-drive /dev/sdc

Ответить | Правка | К родителю #6 | Наверх | Cообщить модератору

20. "Наверно вирус злобный подцепил?"  +/
Сообщение от Аноним (20), 24-Июн-23, 09:24 
>>> Прошивку фирмвари на WD знает кто как дампануть/перепрошить?

Нашел способ дампануть прошивку WDC WD1600JS-22NCB1 https://www.hddsuperclone.com/hddsupertool


hddsuperclone --quiet --tool --file 'wd_royl_read_rom' file=='WD1600JS-22NCB1.ROM' --target '/dev/sda'


Ответить | Правка | Наверх | Cообщить модератору

17. "Наверно вирус злобный подцепил?"  +/
Сообщение от Аноним (17), 26-Апр-23, 09:31 
"Есть подозрение что диск уходит в PIO mode. Как исправить?"
https://forum.ixbt.com/topic.cgi?id=11:38575

Мне кажется это оно, или очень похожие симптомы.

С прошивкой проблемы, если кто знает где взять версию 02E02 и как прошить WD1600JS-22NCB1 с помощью sg_write_buffer буду очень благодарен.

WDC WD1600JS-22NCB1 10.02E02

https://firmware.hddsurgery.com/dl.php?file=16999&filename=W...
https://firmware.hddsurgery.com/dl.php?file=17000&filename=W...
https://firmware.hddsurgery.com/dl.php?file=17001&filename=W...
https://firmware.hddsurgery.com/dl.php?file=23910&filename=W...
https://firmware.hddsurgery.com/dl.php?file=32566&filename=W...
https://firmware.hddsurgery.com/dl.php?file=32594&filename=W...


https://files.elektroda.pl/291943,wdc+wd1600js-22ncb1-10.html
https://www.elektroda.pl/rtvforum/topic962247.html#4975632

https://www.harddrive-repair.com/index_htm_files/Hawk.rar

https://forums.overclockers.ru/viewtopic.php?p=6834788#p6834788

Ответить | Правка | К родителю #6 | Наверх | Cообщить модератору

19. "Наверно вирус злобный подцепил?"  +/
Сообщение от Аноним (19), 26-Апр-23, 12:20 
http://www.datadonor.net/HD%20Western%20Digital/Bl...
http://www.datadonor.net/HD%20Western%20Digital/Bl...
Таки санкции мешают.
Ответить | Правка | Наверх | Cообщить модератору

18. "Наверно вирус злобный подцепил?"  +/
Сообщение от Аноним (17), 26-Апр-23, 09:36 
А как скачать текущую прошивку с диска WDC WD1600JS-22NCB1
sg_read_buffer у меня не заработал (sg3_utils-1.15)
hdparm только шить умеет, а считать прошивку почемуто нет.
flashrom кажись не знает как скачать прошивку с WDC WD1600JS или у меня не заработал.
Ответить | Правка | К родителю #6 | Наверх | Cообщить модератору

8. "Наверно вирус злобный подцепил?"  +/
Сообщение от Аноним (8), 21-Апр-23, 20:55 
> Слишали о вирях которые херят винты? Склоняюсь к вирусу.

Ересь. Сейчас вирьё связано с интернетом и прошивки диска давно никого не интересуют, кроме криминалистов.

> Прошивку фирмвари на WD знает кто как дампануть/перепрошить?

См. сайты, где упоминают про MHDD. Она же может помочь снять, навести доп. диагностику.

Можно встретить упоминания про сдохшую электронику. Та плата привинченная к диску.   Но это уже непросто, можно сломать. Тогда проще показать девайс специалистам.

Ответить | Правка | К родителю #5 | Наверх | Cообщить модератору

15. "Наверно вирус злобный подцепил?"  +/
Сообщение от Аноним (15), 22-Апр-23, 14:22 
> Сейчас вирьё связано с интернетом и прошивки диска давно никого не интересуют, кроме криминалистов.

Врятли они будут интересоватся моим диском. Разве что за матюк здесь на один из языков местные "криминалисты" фирмварь диска испортили.

Ответить | Правка | Наверх | Cообщить модератору

9. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (8), 21-Апр-23, 20:58 
> Кстати, какие-то ошибки после тестирования могут и исчезнуть.

Да.

Многократная перезапись/чтение могут оживить сектор. Общий ресурс диска больше от того не станет.

Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

4. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от lavremail (ok), 21-Апр-23, 13:02 
> WDC WD1600JS
> Пробег - 48637 часа

^^^^^^^^^^^^^^^^^^^^^
на многих моделях WD и Seagate начинается просадка
скорости при большом пробеге, старый факт.
Ну и нужно смотреть параметры и специфику данной модели,
я обычно следующие параметры смотрю: egrep '(AWRE| ARRE| WCE| RCD| PM| IDLE| STANDBY| EN_BMS)'

ps. сама модель то вроде не шустрая, кеш маленький, sata-2 = 3gbps

Ответить | Правка | Наверх | Cообщить модератору

11. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (10), 22-Апр-23, 07:37 
>> WDC WD1600JS
>> Пробег - 48637 часа
> ^^^^^^^^^^^^^^^^^^^^^
> на многих моделях WD и Seagate начинается просадка скорости при большом пробеге, старый факт.
> Ну и нужно смотреть параметры и специфику данной модели, я обычно следующие параметры смотрю: egrep '(AWRE| ARRE| WCE| RCD| PM| IDLE| STANDBY| EN_BMS)'

zgrep -aE '(AWRE|ARRE|WCE|RCD|IDLE|STANDBY|EN_BMS)' /var/log/*
пусто.

zgrep -aE '( PM|)' /var/log/*
в dmesg есть записи, но с диском не связано.

Есть логи аудита команд пользователей и 3Gb логов всех процесов pacct

grep -a делаю потому, что было жесткое выключение питания и во всех открытых на запись файлах есть строка "нулей" '^@^@^@^@^@^@^@^@^@.....^@^@^@^@^@^@^@' и наверно после него начались сразу тормоза на запись.

> ps. сама модель то вроде не шустрая, кеш маленький, sata-2 = 3gbps

Не шустрая, но скорость записи просела в 20 раз за раз, одномоментно, с 50 Mb/s до 2 Mb/s.

Ответить | Правка | Наверх | Cообщить модератору

7. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (8), 21-Апр-23, 20:46 
Этот диск черепичный (я модель не гуглил)? Черепичные - эпическая подстава с просадкой по скорости.

> Пробег - 48637 часа

5 лет и полгода. Это много.

> Ошибок чтения - 2 обе на 42234 часу работы

Могло питание взглюкнуть в тот день. А может и правда что-то было в диске.

> smartctl -a /dev/sda
> тесты проходит без ошибок

Тесты - это что сейчас.

Ещё важна талица и разбор параметров. Вних что было раньше, какого именно рода были ошибки. Было reallocated sectors на запасные, например. Какая частота "штатных" corrections на лету. Перебрать все параметры из таблицы с документацией и поисковиком на перевес.


> dd if=/dev/urandom of=/dev/sda bs=1M status=progress

Размер 2M, вроде, оптимальнее по скорости. Но зависит, надо пробовать...

Т.к. не интересуют задержки от прочего железа из-за генерации рандомных данных (это замедляет), то лучше


sudo dd if=/dev/zero of=/dev/sda bs=2M

а из соседнего терминала постреливать (в Linux варианте dd)


sudo killall -USR1 dd

Или status=progress

После 50% механич. диска скорость заметно падает. Это норма. К концу диска в норме до 50% (в 0.5 раза), насколько помню прошлое эникея. Это, конечно, никак не в 20 раз.

> работы диска нет. Есть мнение, что горение лампочки и тихая работа
> диска свидетельствуют о проблеме в механики - выходит из строя мотор
> вращающий блины.

Кроме мотора есть ещё привод головок - тоже механика.

Стрёкот создаёт метание головок между позициями на пластинах. А здесь идёт последовательная запись блок за соседним блоком без метания в разные места. Т.к. пишет простую реку данных в сектора подряд. Когда на диске файловая система и зпись в файлы, то пишет только на своб. место, раскиданное произвольно по диску и это метание слышно. Потому и тихо, что от dd льёт в сектора тупо по порядку номеров.

> Вирус вредит или диск дохнет?

Кабель данных, кабель питания, проблемы по мат.плате по питанию, сам блок питания Ок? Напряжения всюду на всех режимах больше 3.3В, 5.0В, больше 12.0 Volt??? Если меньше номинала на 0.3В, то повод задуматься, но ещё будет хватать. Если меньше номиналов на 0.5В, то паралельно проверить любого рода проблемы по питанию во всех компонентах (0.5 - это уже большое отклонение, ненорма).

Кабели данных нередко кучей есть новые...

Признаков вирусов тут точно нет. И в прошивку они точно не влезут.

5,5 лет - много для диска десктопа. Неповезло именно с этим или питанием/кабелями, скорее всего. Нужно разбираться с аппаратными параметрами. Не забывая про контроллеры на мат.плате (это они подключены к диску и тоже могут выбирать скорость).

Ответить | Правка | Наверх | Cообщить модератору

12. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (12), 22-Апр-23, 08:37 
>> Ошибок чтения - 2 обе на 42234 часу работы
> Могло питание взглюкнуть в тот день. А может и правда что-то было в диске.
> Ещё важна талица и разбор параметров. Вних что было раньше, какого именно  рода были ошибки. Было reallocated sectors на запасные, например. Какая частота  "штатных" corrections на лету. Перебрать все параметры из таблицы с документацией и поисковиком на перевес.

В логах этих ошибок написано что диск находится в "неизвестном состоянии" сама ошибка "READ DMA" есть дамп регистров после ошибок и дамп команд до ошибки. Во время самой ошибки состояние неизвестно. Эти ошибки случились больше года назад.

Есть в логах макс температура 87C при макс допустимой только 70С даты события нет.
Есть сообщение что в прошлом был зафиксирован сбой в датчике температуры воздуха между блинами диска, даты нет.

Другие ошибки по нулям. Все перфейл ошибки по нулям.


>> Есть мнение, что горение лампочки и тихая работа диска свидетельствуют о проблеме в механики - выходит из строя мотор вращающий блины.
> Кроме мотора есть ещё привод головок - тоже механика.
> Стрёкот создаёт метание головок между позициями на пластинах.

Стрекота нет! Работа диска СЛИШКОМ ТИХАЯ, лампочка горит, IO 100%, все подвисает, а записи реальной на диск нет, как будто пишет скачками, с задержками 1-2 минуты. Особо проявляется в dd и sync. Какой то ядерный процес [jbd2/dm-3-8] при sync жрёт IO.

Мне сказали что умерает механика, а именно мотор вращающий блины, не хватает ему мощи разогнать блины, электроника диагностирует недостаточную скорость вращения блинов для записи, блокирует запись, пытается откалибровать скорость вращения, увеличить её разгоняя блины, по этому и притормаживает всё на запись. Но это все не точно.

>> Вирус вредит или диск дохнет?
> Кабель данных, кабель питания,

Нормальные.

> проблемы по мат.плате по питанию, сам блок питания Ок? Напряжения всюду на всех режимах больше 3.3В, 5.0В, больше 12.0 Volt??? Если меньше номинала на 0.3В, то повод задуматься, но ещё будет хватать. Если меньше номиналов на 0.5В, то паралельно проверить любого рода проблемы по питанию во всех компонентах (0.5 - это уже большое отклонение, ненорма).

Не проверял тестером. Возможно мало вольтажа для мотора и он не выдает нужную мощность.

Ни настройки железа, ни сама OS не изменялись. Упала в 29 раз скорость записи на диск.

> Признаков вирусов тут точно нет. И в прошивку они точно не влезут.

Ошибок нет. А скорость записи упала в 20раз. Провел > 10 тестов. Результаты повторяемые. Если бы вольтаж прыгал, то иногда скорость записи подымалась бы до нормы.

AIDE зафиксировала изменение прав на /dev/console с 600 на 622 !

Вирь, буткит, в прошивке диска очень вероятен. Он и тормозит регуларно.

В логах ядра появились редкие (раз в несколько дней), но регулярные записи:


kernel: INFO: task jbd2/dn-3-8:68496 blocked for more then 120 seconds.
длинный трейс ведра...

есть трейсы и от других процесов, даже обычных пользовательских на чтение диска.

Буткит в прошивке диска или мамки очень вероятен.

Ответить | Правка | Наверх | Cообщить модератору

13. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (15), 22-Апр-23, 13:58 
У меня cбой/заражение диска сопровождается в логах этими симптомами:
https://access.redhat.com/solutions/408833
https://access.redhat.com/solutions/4319241
https://support.oracle.com/knowledge/More%20Application...

INFO: task jbd2/dm-47-8:6937 blocked for more than 120 seconds.
"echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
jbd2/dm-47-8  D 000000000000000b     0  6937      2 0x00000080
ffff8a1fd1363d20 0000000000000046 0000000000016700 0000000000016700
ffff8a1fd34bd800 0000000000016700 0000000000016700 ffff8a1fd0493540
ffff8a1fd0493af8 ffff8a1fd1363fd8 000000000000fb88 ffff8a1fd0493af8
Call Trace:
[<ffffffff81096f8e>] ? prepare_to_wait+0x4e/0x80
[<ffffffffa025a7cf>] jbd2_journal_commit_transaction+0x19f/0x14b0 [jbd2]
[<ffffffff810096f0>] ? __switch_to+0xd0/0x320
[<ffffffff8105e759>] ? find_busiest_queue+0x69/0x150
[<ffffffff81080fcc>] ? lock_timer_base+0x3c/0x70
[<ffffffff81096ca0>] ? autoremove_wake_function+0x0/0x40
[<ffffffffa0260f38>] kjournald2+0xb8/0x220 [jbd2]
[<ffffffff81096ca0>] ? autoremove_wake_function+0x0/0x40
[<ffffffffa0260e80>] ? kjournald2+0x0/0x220 [jbd2]
[<ffffffff81096936>] kthread+0x96/0xa0
[<ffffffff8100c0ca>] child_rip+0xa/0x20
[<ffffffff810968a0>] ? kthread+0x0/0xa0
[<ffffffff8100c0c0>] ? child_rip+0x0/0x20
Kernel panic - not syncing: hung_task: blocked tasks

Чуть другое в трейсе, но ошибка точно эта:

INFO: task jbd2/dm-3-8:245647 blocked for more than 120 seconds.

Ядро едет дальше и все работает. Какая у меня нагрузка на рабочью станцию? Наверно мало для clamd RAM, а баз много. Вот во врема обновления баз clamd и чуть грузит систему.
Ответить | Правка | Наверх | Cообщить модератору

14. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (15), 22-Апр-23, 14:15 
На этот лог наверно обращать внимания не надо, это симптомы, болезни.
irqbalance запущен.

Проблема таки аппаратна в диске, при записи/считывании обновлённых баз clamd подвешивает систему из-за 100% загрузки IO диска. Рашать надо проблему с диском.

Ответить | Правка | Наверх | Cообщить модератору

21. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (21), 24-Июн-23, 17:39 
Диску 15 лет или около того. Он истлел! Уже SSD на такой объем стоят порядка 1000р. По цене трех пачек пельменей можно купить диск, который будет во всем лучше. Какой-то предел должен быть в жлобстве.
Ответить | Правка | Наверх | Cообщить модератору

22. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (22), 01-Июл-23, 08:57 
Пару лет назад купил другой диск. А старый использовал только для итернетов.

Вопрос не о новом диске. Вопрос как скачать прошивку диска, для верификации. Это вопрос из раздела о безопасности, а не экономики.

Пока получилось скачать прошивку WDC WD1600JS-22NCB1 только проприетарной прогой https://www.hddsuperclone.com/hddsupertool :


hddsuperclone --quiet --tool --file 'hddscripts/wd_royl_read_rom' file=='WD1600JS-22NCB1.ROM' --target '/dev/sda'

И не получилось скачать модули прошивки диска:

hddsuperclone --quiet --tool --file 'hddscripts/wd_royl_dump_mod_all' --target '/dev/sda'

hdparm - почему-то поддерживает только заливку прошивок. Скачать текущую прошивку с помощью hdparm нельзя. Это существенный недочёт.

К сожалению для WD1600JS-22NCB1 компания Western Digital не приветствует скачку прошивок. Это сказывается на поддержке их дисков в  sg3_utils https://sg.danny.cz/sg :


sg_read_buffer --readonly --raw --id 0 --mode 3 --specific 0 /dev/sg0 > WD1600JS-22NCB1.ROM1

sg_ses --readonly --raw --raw --page dm /dev/sg0 > WD1600JS-22NCB1.ROM2

sg_raw --binary --readonly --request 572 /dev/sg0 12 01 89 02 3C 00 |dd of=WD1600JS-22NCB1.ROM3 bs=1c skip=60 status=none


Если кто знает как скачать прошивку диска с помощью sg3_utils https://sg.danny.cz/sg буду очень благодарен.
Ответить | Правка | Наверх | Cообщить модератору

23. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (23), 01-Июл-23, 13:02 
Первый сектор прошивы можно также скачать:

hdparm -q -Istdout /dev/sda

а расшифровку данных первого сектора лучше всего смотреть:

smartctl --identify=w /dev/sda

Ответить | Правка | Наверх | Cообщить модератору

24. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аногни (?), 01-Июл-23, 14:36 
Есть официальный документ: https://documents.westerndigital.com/content/dam/doc-library... в котором имеется раздел: "1.5.2 Upgrading Enclosure Firmware—Linux OS" апгрейд делается с помощью sg3-utils. Поддерживаются HGST диски.

У кого есть возможность скачать скрипт Ultrastar_Data60_102_FWUpdate в котором есть команды sg_* для загрузки фирмвари? Хочу их посмотреть чтобы дампануть фирмварь с воего диска.

Ответить | Правка | К родителю #22 | Наверх | Cообщить модератору

25. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (25), 04-Июл-23, 16:42 
На таком старом харде данные опасно хранить просто из-за того, что он может внезапно крякнуться. Это намного вероятнее, чем то, что какие-то хакеры влезут в прошивку.
Ответить | Правка | К родителю #22 | Наверх | Cообщить модератору

26. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (26), 05-Июл-23, 08:32 
Не использую этот диск для хранения данных. На этом диске стоит система для ходьбы по интернетах. Да диск старый, но работает хорошо.

Давайте отойдём от темы конкретно этого диска и рассмотрим общий вопрос: "Как скачать прошивку (ROM, firmware, microcode) с диска? Рассмотрим все варианты скачивания прошивы диска и для всех девайсов, а не только WDC.

Часть настроек диска можно дампануть с помощью команды:


sg_raw --binary --readonly --request 572 /dev/sg0 12 01 89 02 3C 00 2>/dev/null |dd of=ROM.bin -bs=1c --skip=60 status=none

Кажется она универсальна и работает на всех SCSI дисках.

sg_raw в теории должен работать всегда и для всех SCSI дисках. Вопрос в опкодах для конкретных устройств. Пробовал переписать, рабочий у меня скрипт wd_royl_read_rom и не рабочий wd_royl_dump_mod_all ( https://drive.google.com/drive/folders/1DBhsAmepV_H2RxAWxyo7... ) с помощью sg_raw & bash но пока безуспешно.

Ответить | Правка | Наверх | Cообщить модератору

27. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (27), 08-Июл-23, 07:24 
Дампит 1 сектор прошивки с идентификацией жесткого диска:
 
sg_raw --binary --readonly --request 512 /dev/sg0 85 08 0E 00 00 00 01 00 00 00 00 00 00 40 EC 00 > ROM.bin

Ответить | Правка | Наверх | Cообщить модератору

28. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (27), 08-Июл-23, 09:23 
У меня с помощью sg3_utils не работают opcode:
 
sg_raw --binary --readonly --request 572 /dev/sg0 45 0B 00 44 57 A0 80
sg_raw --binary --readonly --request 572 /dev/sg0 45 B0 00 44 57 A0 80

А здесь: https://forum.hddguru.com/viewtopic.php?t=26971 утверждается что этот опкод подходит.
Также работает wd_royl_read_rom с https://drive.google.com/drive/folders/1DBhsAmepV_H2RxAWxyo7... который использует "45 0B 00 44 57 A0 80".

Может sg_raw как то неправильно запускаю?

Ответить | Правка | К родителю #26 | Наверх | Cообщить модератору

29. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (29), 14-Июл-23, 07:29 
> Может sg_raw как то неправильно запускаю?

Наконец удалось дампануть прошивку WDC WDxxxxJS-* Она физически разделена на две части: ядро OS - ROM на SPI Flash и модули с логами и статистикой которые находятся в спец областях на самих блинах:

'Data/ROM/ROM_WDC WD1600JS-22NCB1.bin' 131072 bytes, SHA1: 74808cbd68c464a52a793e747eb2f9cada08e2e7

Data/Modules/ ... 115 модулей общим размером 5 976 576 bytes

Western Digital, по понятным причинам, секретит операционные коды OS на ATA дисках. В интернетах можно, но сложно, найти эти операционные коды. Угадать их невозможно, необходимо выгуглить.

Правильный запуск sg_raw в общем варианте:
? - 0..9A..F
N - 0..9
varN - ??
Посылка комманды на диск:


printf "\x??\x??\x00\x${var1}\x${var2}\x00...\x00" |sg_raw --readonly --send 512 /dev/sg0 ?? ${var3} ?? ?? ... ??

Считывание результата с диска:

let block=512
let size=NNN
let b=1
while [ ${b} -lt ${size} ]
  do
    sg_raw --binary --readonly --request ${block} /dev/sg0 ?? ${var4} ${var5} ?? ?? ... ?? >> result_file.bin
    let b=${b}+1
  done

Посылаемую на диск бинарную команду: "\x??\x??\x00\x${var1}\x${var2}\x00...\x00" и посылаемый на диск операционный код ?? ${var3} ?? ?? ... ?? необходимо найти в инетах, несмотря на секретность их можно найти на неофициальных сайтах в публичном доступе. Отдельно надо обрабатывать ошибки от диска передаваемые sg_raw.

Займусь теперь "новым" Seagate. Предложения по считыванию прошивы с дисков приветствуются. Пока решил все делать строго на bash + sg_raw, этого вполне хватает.

Ответить | Правка | Наверх | Cообщить модератору

30. "Пару недель назад в 20 раз упала скорость работы диска WD SATA."  +/
Сообщение от Аноним (30), 15-Июл-23, 12:08 
По теме, скорость записи на диск удалось вернуть на прежнюю ~55Mb/s. Путём анализа настроек и изменения одного параметра настройки:

hdparm -m 16 /dev/sda

Все тесты диск проходит без ошибок.

> какие-то хакеры влезут в прошивку.

Думаю уже влезли в прошиву диcка. Пока прошивки скачанные с инетов имеют другую дату. По этому хеши не совпали.

Просканил clamav, нашел:
Data/Modules/24.rpm    YARA.padding_used_in_hashing_algorithms__0x80_0____0___8_byt_64_
Data/Modules/61.rpm    YARA.libntlm_DES_key_swap__32_big_64_
                                   YARA.DES_sbox
                                   YARA.RawDES_sbox1__32_lil_256_
Data/Modules/DE.rpm   YARA.aspr11_brs

Брутефоснул 2^6 адресов прошивы для поиска скрытых модулей, ничего не нашлось кроме, ранее найденых, 115 модулей.

https://www.wired.com/2015/02/nsa-firmware-hacking/

Для Ъ:

One of the most shocking parts of the recently discovered spying network Equation Group is its mysterious module designed to reprogram or reflash a computer hard drive's firmware with malicious code. The Kaspersky researchers who uncovered this said its ability to subvert hard drive firmware---the guts of any computer---"surpasses anything else" they had ever seen.

The hacking tool, believed to be a product of the NSA, is significant because subverting the firmware gives the attackers God-like control of the system in a way that is stealthy and persistent even through software updates.

...................

“Taking into account the fact that their GrayFish implant is active from the very boot of the system, they have the ability to capture the encryption password and save it into this hidden area,” Raiu says.

Authorities could later grab the computer, perhaps through border interdiction or something the NSA calls "customs opportunities," and extract the password from this hidden area to unlock the encrypted disk.

..................

По этому стоит написать скрипты для дампа прошивок дисков с помощью sg_raw (sg_read_buffer). В инетах есть кучу инфи как залить прошивку на диск, а как дампануть прошивку с диска нет.

Ответить | Правка | К родителю #25 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру