1. >
  2. Форум >
  3. Научно-технический раздел

IT в России и мире в реалиях мирового кризиса

Поделиться в социальных сетях:
Поверонов
 
Слушатель
Карма: +35.19
Регистрация: 05.06.2010
Сообщений: 14,677
Читатели: 8
Даааа? Ну есть у нас RAID1. Скраб словил разницу в данных. Который блин верный? Ась?
"Логика рейда" не про исправление чуши, а про собсно возможность чейта прочесть в принципе. Эх, реальность, бессердечная ты сука
При таких делах дублирования недостаточно - потребуется голосование на троих. Заодно и сбыт возрастет - вместо дублирования - утроение
+0.03 / 2
АС / АУ
ps_
 
Слушатель
Карма: +7.62
Регистрация: 04.04.2009
Сообщений: 3,084
Читатели: 2
При таких делах дублирования недостаточно - потребуется голосование на троих. Заодно и сбыт возрастет - вместо дублирования - утроение
Помнится мне показывали ИБМ-овский чип для сверх надежных вычислений. Там стояло два кора и КАЖДАЯ операция делалась на обоих.
Между ними стоял маленький модуль, который сравнивал результат и в случае несовпадения мог открутить назад и повторить операции, начиная с ошибочьной
+0.01 / 1
Скрыто
Поверонов
 
Слушатель
Карма: +35.19
Регистрация: 05.06.2010
Сообщений: 14,677
Читатели: 8
Помнится мне показывали ИБМ-овский чип для сверх надежных вычислений. Там стояло два кора и КАЖДАЯ операция делалась на обоих.
Между ними стоял маленький модуль, который сравнивал результат и в случае несовпадения мог открутить назад и повторить операции, начиная с ошибочьной
Так можно компенсировать случайную временную помеху ( типа электромагнитной наводки ) но невозможно постоянное искажение на одном из сравниваемых источников - получится бесконечный цикл сравнений
+0.00 / 0
АС / АУ
Podli
 
Белоруссия
Минск
36 лет
Слушатель
Карма: +4.24
Регистрация: 19.03.2016
Сообщений: 750
Читатели: 0
Так можно компенсировать случайную временную помеху ( типа электромагнитной наводки ) но невозможно постоянное искажение на одном из сравниваемых источников - получится бесконечный цикл сравнений
Брак в ядре отлавливают на производстве специальными тестами. И чинят путем отключения дефектного ядра и объявлением ентого проца процом более дешевой серии с меньшим количеством ядер.
+0.01 / 1
АС / АУ
Longspig
 
Слушатель
Карма: +16.94
Регистрация: 05.01.2014
Сообщений: 1,446
Читатели: 1
Смешались в кучу кони люди. Ну, тоесть DRAM с НЖМД А этот феномен давно на практике пользуют.
Это не "феномен". Это то - "чего не должно быть, потому что не должно быть никогда". Код моей программы может случайно совпасть с "феноменом" и начать произвольно менять содержимое памяти.
С НЖМД то же самое. Если диск выдает ложные данные, он должен взводить состояние ошибки. Рейды работают на этом принципе. Именно так определяется, какое "зеркало" содержит валидные данные. На самом "блине" данные защищены контрольными суммами и бит ошибки взводится по несовпадению КС. Но сейчас, при нарушении трансляции второго уровня, SMR-ы выдают или нули или паттерн. Как зеркальный рейд узнает, "кто прав"? Для того, у Sun был (и есть) серверный формат сектора 528 байт, т.е. сектор 512 + "сквозная" КС от хоста до харда.
.
То что творят сейчас - развитие нынешней тенденции - сперва зарезали ресурс, а теперь взялись за надежность и достоверность.
ИМАО решили принудительно "выпихивать" пользователей выносить свою инфу "в облака" (зачем!? - "а вы когда-нибудь читали чужие письма")
А потребность в дублирующем железе дает кратный прирост продаж.
+0.01 / 1
АС / АУ
Longspig
 
Слушатель
Карма: +16.94
Регистрация: 05.01.2014
Сообщений: 1,446
Читатели: 1
Брак в ядре отлавливают на производстве специальными тестами. И чинят путем отключения дефектного ядра и объявлением ентого проца процом более дешевой серии с меньшим количеством ядер.
Так по ссылке - нынешний брак таков, что уже не ловится на производстве.
Я в жизни встретил всего один случай брака процессора (286-й AMD не проходил тест флагов регистра состояния). По DRAM случаев уйма, а вот процессоры были "островом стабильности... были...
.
- Вовочка, предложение - "я красива" это какое время?
- прошедшее, МарьВанна, прошедшее...
Отредактировано: Longspig - 10 июня 2021 12:25:47
+0.02 / 2
АС / АУ
Podli
 
Белоруссия
Минск
36 лет
Слушатель
Карма: +4.24
Регистрация: 19.03.2016
Сообщений: 750
Читатели: 0
Так по ссылке - нынешний брак таков, что уже не ловится на производстве.
Я в жизни встретил всего один случай брака процесора (286-й AMD не проходил тест флагов регистра состояния). По DRAM случаев уйма, а вот процессоры были "островом стабильности... были...
.
- Вовочка, предложение - "я красива" это какое время?
- прошедшее, МарьВанна, прошедшее...
Хз, у нас проблемы с процессорами в разы реже, чем с памятью встречаются. Хотя и память вполне себе надежная штука, какие-либо веселости встречаются весьма редко. Процов многие тысячи, так что выборка вполне себе презентабельная. И да, я про недешевые сервера, а не про пользовательское железо.
+0.03 / 1
АС / АУ
Longspig
 
Слушатель
Карма: +16.94
Регистрация: 05.01.2014
Сообщений: 1,446
Читатели: 1
Хз, у нас проблемы с процессорами в разы реже, чем с памятью встречаются. Хотя и память вполне себе надежная штука, какие-либо веселости встречаются весьма редко. Процов многие тысячи, так что выборка вполне себе презентабельная. И да, я про недешевые сервера, а не про пользовательское железо.
Вот вряд ли Facebook бюджетное железо для своих серверов использует. Да и наличие 59-го ядра о чем-то да говорит:
Цитата
После нескольких повторений на устройстве исследователи поняли, что вычисление Int (1.1^53) в качестве входных данных для функции math.pow в Scala всегда выдаёт результат 0 на ядре 59 процессора. Когда они заменили вычисление на Int (1.1^52), программа выдала ожидаемый результат 142.
+0.03 / 1
АС / АУ
Podli
 
Белоруссия
Минск
36 лет
Слушатель
Карма: +4.24
Регистрация: 19.03.2016
Сообщений: 750
Читатели: 0
Вот вряд ли Facebook бюджетное железо для своих серверов использует. Да и наличие 59-го ядра о чем-то да говорит:
Бывает. 100% надежности нет нигде, так что по единичным случаям начинать кричать о всепропадании всеполимеров просто глупо.
+0.00 / 0
АС / АУ
gvf
 
48 лет
Слушатель
Карма: +9.17
Регистрация: 06.03.2012
Сообщений: 6,311
Читатели: 6
Вот вряд ли Facebook бюджетное железо для своих серверов использует. Да и наличие 59-го ядра о чем-то да говорит:
Зависит от цены вопроса.
Гугль имеет высокую степень дублирования, чисто архитектурно, использует обычное дешевое железо, выход из строя и замена является плановыми операциями. Стоимость владения оказалась оптимальной именно в таком режиме.
Речь, понятное дело о кешах, дисках, не вычислительных ДЦ сдаваемых в аренду.
+0.07 / 4
АС / АУ
qurvax
 
Литва
Вильнюс
Слушатель
Карма: +8.73
Регистрация: 29.03.2017
Сообщений: 872
Читатели: 1
Помнится мне показывали ИБМ-овский чип для сверх надежных вычислений. Там стояло два кора и КАЖДАЯ операция делалась на обоих.
Между ними стоял маленький модуль, который сравнивал результат и в случае несовпадения мог открутить назад и повторить операции, начиная с ошибочьной
По уму - должно быть три, и "выборы тридвараса" путем большинства. Иначе возможна ситуация у ойтишнегов зовущаяся "сплит-брейн".
+0.03 / 1
АС / АУ
qurvax
 
Литва
Вильнюс
Слушатель
Карма: +8.73
Регистрация: 29.03.2017
Сообщений: 872
Читатели: 1
Это не "феномен". Это то - "чего не должно быть, потому что не должно быть никогда". Код моей программы может случайно совпасть с "феноменом" и начать произвольно менять содержимое памяти.
Это не верно. Особенности технологии говорят, что это не то что "вероятно", а вполне закономерно. Т.е. так и должно быть. Дьявол в деталях, как всегда.

С НЖМД то же самое. Если диск выдает ложные данные, он должен взводить состояние ошибки. Рейды работают на этом принципе. Именно так определяется, какое "зеркало" содержит валидные данные. На самом "блине" данные защищены контрольными суммами и бит ошибки взводится по несовпадению КС. Но сейчас, при нарушении трансляции второго уровня, SMR-ы выдают или нули или паттерн. Как зеркальный рейд узнает, "кто прав"? Для того, у Sun был (и есть) серверный формат сектора 528 байт, т.е. сектор 512 + "сквозная" КС от хоста до харда.
.

Сейчас идут путем посылки лесом рейд-контроллеров и реализации всего на софте, сo сквозной интеграцией всяких там избыточных данных на нескольких уровнях. SDS зовется. Венда умеет. Storage Spaces и ReFS именно про это вот все.
+0.03 / 1
АС / АУ
ps_
 
Слушатель
Карма: +7.62
Регистрация: 04.04.2009
Сообщений: 3,084
Читатели: 2
По уму - должно быть три, и "выборы тридвараса" путем большинства. Иначе возможна ситуация у ойтишнегов зовущаяся "сплит-брейн".
Я говорю про то, что лично видел.
Это был конец 90-х и может быть три ядра было тяжело делать.

Там говорилось, что то по поводу финансовых вычислений и если процессоры полностью запутались, то самое надежное - это совсем остановить машину, чем считать неизвестно что Подмигивающий
+0.05 / 2
Скрыто
gvf
 
48 лет
Слушатель
Карма: +9.17
Регистрация: 06.03.2012
Сообщений: 6,311
Читатели: 6
Я говорю про то, что лично видел.
Это был конец 90-х и может быть три ядра было тяжело делать.

Там говорилось, что то по поводу финансовых вычислений и если процессоры полностью запутались, то самое надежное - это совсем остановить машину, чем считать неизвестно что Подмигивающий
Все верно, задача компаратора выявить неисправный проц, а не правильно посчитать (довести самолет до посадки в аэропорту - "три датчика угла атаки" (с))
+0.07 / 3
АС / АУ
Podli
 
Белоруссия
Минск
36 лет
Слушатель
Карма: +4.24
Регистрация: 19.03.2016
Сообщений: 750
Читатели: 0
Сейчас идут путем посылки лесом рейд-контроллеров и реализации всего на софте, сo сквозной интеграцией всяких там избыточных данных на нескольких уровнях. SDS зовется. Венда умеет. Storage Spaces и ReFS именно про это вот все.
Отсутствие кэша на запись приводит к заметному снижению производительности дисковой подсистемы в ряде случаев, потому от RAID контроллеров оказываться себе дороже.
+0.00 / 0
АС / АУ
GrinF
 
Слушатель
Карма: +59.01
Регистрация: 15.02.2018
Сообщений: 4,183
Читатели: 1
Все верно, задача компаратора выявить неисправный проц, а не правильно посчитать (довести самолет до посадки в аэропорту - "три датчика угла атаки" (с))
Компаратор нисколько не поможет выявить несправный процессор. Он только говорит что данный шаг вычисления некорректный, ибо процессора только 2 и неизевстно кто лажанулся и по какой причине...
+0.04 / 3
АС / АУ
gvf
 
48 лет
Слушатель
Карма: +9.17
Регистрация: 06.03.2012
Сообщений: 6,311
Читатели: 6
Компаратор нисколько не поможет выявить несправный процессор. Он только говорит что данный шаг вычисления некорректный, ибо процессора только 2 и неизевстно кто лажанулся и по какой причине...
Вероятность ошибки в проце это миллиардные доли, совершенно неважно какой из двух и по какой причине, важен сам факт ошибки в одном из, и это уже достаточное основание для замены.
Никто не будет разбираться в чем причина ошибки, тем более что речь не о сути самой ошибки (т.е. ошибки в микрокоде приводящие к неверному результату но синхронно на обоих процах не являются поводом для замены), а только в несовпадении результатов двух полностью идентичных.
+0.03 / 1
АС / АУ
ps_
 
Слушатель
Карма: +7.62
Регистрация: 04.04.2009
Сообщений: 3,084
Читатели: 2
Вероятность ошибки в проце это миллиардные доли, совершенно неважно какой из двух и по какой причине, важен сам факт ошибки в одном из, и это уже достаточное основание для замены.
Никто не будет разбираться в чем причина ошибки, тем более что речь не о сути самой ошибки (т.е. ошибки в микрокоде приводящие к неверному результату но синхронно на обоих процах не являются поводом для замены), а только в несовпадении результатов двух полностью идентичных.
Миллиардные доли при тактовой частоте около гигагерца - это ошибка раз в секунду Веселый
Насколько я понимаю, там боролись против ошибок наведенных высокоэнергетическими частицами.
В общем то, и ECC в память ставят для этого.
+0.05 / 3
Скрыто
qurvax
 
Литва
Вильнюс
Слушатель
Карма: +8.73
Регистрация: 29.03.2017
Сообщений: 872
Читатели: 1
Отсутствие кэша на запись приводит к заметному снижению производительности дисковой подсистемы в ряде случаев, потому от RAID контроллеров оказываться себе дороже.
В огороде бузина а кеш в каждом диске, нонече, свой. У энтерпрайза - с соответствующей защитой данных от пропажи питания. Рэйд-контроллеры для этого не обязательны. А у SDS, обычно, под кеширование даже выделенные SSD, уж не говоря про несколько уровней кеша лежащих в RAM хостов.
Отредактировано: qurvax - 11 июня 2021 13:32:41
+0.03 / 1
АС / АУ
gvf
 
48 лет
Слушатель
Карма: +9.17
Регистрация: 06.03.2012
Сообщений: 6,311
Читатели: 6
Миллиардные доли
Смотря от чего считать.
Число выполненных операция меня в данном контексте никак не парит.
А вот срок эксплуатации в 5-7 лет на количество установленных процов, таки да, и выражается в конкретной сумме договорных обязательств, включая гарантийную замену.
+0.02 / 1
АС / АУ