>Ошибки интерфейса отлавливаются точно (см. SMART). Буферная память ЖД также может быть проверена (MHDD, Victoria). Питание, уж извините, ИБП решает. Память тоже с избыточностью бывает, вплоть до восстановления информации "на лету". ОС оно конечно серьезно, но такого уровня компоненты, работающие внутри ядра, должны и скорее всего усиленно тестируются. Не надо также забывать и о проверке "временем", т.е. пользоваться не самым новым, а зарекомендовавшим себя ядром/софтом/железом там , где нужна повышенная надежность. Делайте копии, профилактику и будет счастье.В идеальном мире из идеальных программ и идеальной аппаратуры вообще ни журналов, ни fsck не нужно. Одна беда - живем-то мы в реальном :) И смарт не всегда отслеживается, и рейд-контроллер глючит, и банальная несовместимость железа при конкретной версии прошивки винта.
Особенно весело, когда винт не один, а сотня-другая, и тестить их все через MHDD, мягко говоря, некогда.
>Если "зачастую крайне полезно", то у Вас уже есть примеры реализации подобных >возможностей. Если не сложно поделиться инфой, поделитесь.
> Делая своевременные копии информации мне все равно что случится с компом и я всегда >уверен, что если выяснится факт некорректности файла - я смогу взять его из проверенной >копии.
>
> Все проблемы решаемы, и не надо придумывать себе задачи, которые кроме как к новым >проблемам ни к чему не приведут, и их решать.
Ок, пример из реальной жизни. Глючит рейд-контролер. Не так, чтобы вообще сплошной мусор пишет, но иногда с ним такое случается. И до вас это дошло только сейчас.
В разделе несколько десятков терабайт информации, сервак работает и останавливать его крайне не желательно. Восстановление информации из бэкапа - гарантированные пол-суток простоя. Самое обидное, что непонятно - нужно ли вообще делать эти действия, быть может, вся инфа на разделе вполне валидная.
И я попадал в эту ситуацию. Единственный плюс - начальство знало, что сервак глючит, и было морально готово к его остановке, благо, его близнец на другом краю России работал без сбоев.
В случае того же ZFS/BTRFS раз в сколько-то времени в фоновом режиме по всему диску проходит демон, проверяя файловые CRC. Если что, он просто кидает мне письмо, что файлы такие-то и такие-то накрылись и резервной копии у системы нет (а бывает, что есть, и демон сам все восстановит). И, зная конкретный убитый файл, я уже буду распаковывать не весь бэкап, а только его малую часть, сэкономив кучу времени. Заодно я буду в курсе, что с файловой системой что-то не так, хотя вся аппаратура мониторинга молчит, как партизан.
P.S. Если какая-то фича для вас не очевидна и не особо нужна, то это еще не значит, что она не нужна другим.