Цитата: Брянский от 20.07.2016 11:31:46не... вы просто не в курсе
Ну во первых как раз недорогие десктопные HDD в RAID массив ставить не нужно - замучаетесь пыль глотать
Можно и иногда нужно - всё зависит от требований к рейду, к его цене, надёжности и нагрузке.
Цитата: ЦитатаА во вторых - HDD из массива вылетают очень даже по разным причинам.
Ситуация когда HDD просто мертв это уж извините совсем клинические случай у олуха-сисадмина
Это вполне себе случающаяся ситуация, например померла логика или повреждена считывающая головка.
Цитата: ЦитатаЧаще всего HDD начинают вылетать по тайм-ауту (в курсе что это?)
при этом как вы понимаете с них можно считать почти всю записанную информацию
Это когда ответ диска не укладывается в заложенные в контролер таймауты. Контролер совершенно справедливо выбрасывает такой диск, так как такая задержка уже означает неисправность диска и необходимость его замены.
Цитата: Цитатаесли вдруг у вас по тайм-ауту вылетели сразу два HDD из тома RAID 5 то вы можете (на правильном контроллере разумеется) ручками загнать обратно в online ПОСЛЕДНИЙ вылетевший HDD после чего можно запустить rebuild и загнать в обратно в массив второй HDD
А потом мучительно долго думать, повредилось ли что-либо в файловой системе, все ли данные консистентны, и мечтать о том, что всё окончится хорошо.
Вероятность такого события микроскопическая, у меня сотни физических серверов, тысячи дисков, выходят из строя они регулярно, не реже раза в 2 недели. Но ситуация с вышедшими из строя сразу 2 дисками у меня была только один раз - когда создал массив из дисков, которые до этого простояли в резерве СХД 6 лет. И если событие с такой ничтожной вероятностью всё же возникнет, то я просто пересоздам массив, просто чтобы быть уверенным, что потери данных нет.
А вообще описываемая вами ситуация подходит только для случая, когда есть 1-5 серверов и админ на каждый из них молится, в случае сбоя диска начинает пытаться восстановить данные. Когда же серверов сотни никто таким не заморачивается, у меня есть рейды от вендора, со своими средствами контроля дисков, в случаях когда диск ещё не умер, но есть намёки на его близкую смерть контролер говорит, что диск в "pre failure" состоянии, значит его надо менять. Если рейд считает диск уже мёртвым, он сразу говорит, что он мёртв и требует его заменить. В обоих вариантах вендор без звука заменяет диск в течении 1-2 дней (есть вариант гарантии с более быстрой заменой).
Лично я вообще не припоминаю ситуации, когда мне бы в рейдах HP, Dell, Sun пришлось бы разбираться с проблемами сохранности информации на дисках в рейде и попытках вытащить информацию оттуда.
Вот с трешем типа LSI или, прости Господи, promise, такое да, бывало, что оно разваливалось само собой, приходилось что-то делать чтобы собрать рейд, как-то вытянуть оттуда информацию (но и тогда о повторном запуске рейда в продакшен и речи не шло). Собственно как только я хорошо познакомился с нормальным железом, я и забил на всяких хлам, типа LSI, SuperMicro и им подобное, так как у нормальных вендоров всё в разы надёжнее, удобнее и лучше масштабируется.
Цитата: ЦитатаТочно так же поступаем если тома RAID разваливаются из-за глюков прошивок или неправильного выключения/включения внешней дисковой полки (те которые без своих контроллеров)
И этот человек
мне запрещает ковыряться в носу рассказывает о том, какой хороший LSI.