1. >
  2. Блог >
  3. Longspig

... до мышей

08 июня 2021 21:45:15   385 44 +0.07 / 4
Интересная статья на Хабре
Микрочипы становятся непредсказуемыми по мере уменьшения техпроцесса
до этого пробегала статья об уязвимости памяти DDR3 и DDR4 когда ячейки, при определеных интенсивных нагрузках "на соседей", меняют свое содержимое.
Ссылку не сохранил, но оригинал статьи называется:
Flipping Bits in MemoryWithout Accessing Them:
An Experimental Study of DRAM Disturbance Errors

.
В общем, основная парадигма цифровой техники - "любая программа запущеная сколько угодно раз с одинаковымаи входными условиями, даст неизменный результат" трещит по всем швам.

От себя добавлю - новое поколение HDD (с SMR технологией). Seagate "впереди планенты всей" - при невозможности отдать корректный сектор по причине нарушения внутренней трансляции адресов (у SMR трансляция двухуровневая), не взводит бит ошибки и выдает на шину некий постоянный паттерн, и что интересно - ненулевой (по состоянию регисторв - операция завершена успешно).
  • +0.07 / 4
Поделиться в социальных сетях:

КОММЕНТАРИИ (44)

  •  2 
  •  3 
  • След→
  gvf
gvf
 
48 лет
Слушатель
Карма: +9.00
Регистрация: 06.03.2012
Сообщений: 5,775
Читатели: 6
От себя добавлю - новое поколение HDD (с SMR технологией). Seagate "впереди планенты всей" - при невозможности отдать корректный сектор по причине нарушения внутренней трансляции адресов (у SMR трансляция двухуровневая), не взводит бит ошибки и выдает на шину некий постоянный паттерн, и что интересно - ненулевой (по состоянию регисторв - операция завершена успешно).
Очевидная логика - HDD без RAID никому не упал. Чушь на выходе конкретного диска исправит логика рейда.
+0.05 / 2
Senya
 
Россия
52 года
Слушатель
Карма: +246.48
Регистрация: 20.11.2008
Сообщений: 20,842
Читатели: 39

Глобальный Модератор
Очевидная логика - HDD без RAID никому не упал. Чушь на выходе конкретного диска исправит логика рейда.
Пока уменьшение на микроуровне будет компенсировать дублирование на макроуровне. Ну и смотреть, как помехоустойчивое кодирование с избыточностью всей информации влияет на быстродействие.
Отредактировано: Senya - 09 июня 2021 07:41:47
"Иван Грозный помещает на рабочий стол полученный от хана ярлык."(с) Не моё.
+0.06 / 4
  gvf
gvf
 
48 лет
Слушатель
Карма: +9.00
Регистрация: 06.03.2012
Сообщений: 5,775
Читатели: 6
Пока уменьшение на микроуровне будет компенсировать дублирование на макроуровне. Ну и смотреть, как помехоустойчивое кодирование с избыточностью всей информации влияет на быстродействие.
Подозреваю, что ЦА этих штук провайдеры с сильно распределенными ФС типа гугла.
Там объем важнее времени и целостности, т.к. высокая степень дублирования
+0.03 / 1
  ps_
ps_
 
Слушатель
Карма: +7.42
Регистрация: 04.04.2009
Сообщений: 3,041
Читатели: 2
Пока уменьшение на микроуровне будет компенсировать дублирование на макроуровне. Ну и смотреть, как помехоустойчивое кодирование с избыточностью всей информации влияет на быстродействие.
Ну а что такого. Я вот, например, не помню точно что я делал год назад. И ничего, живу как-то Веселый
+0.03 / 1
qurvax
 
Слушатель
Карма: +8.70
Регистрация: 29.03.2017
Сообщений: 808
Читатели: 1
Интересная статья на Хабре
Микрочипы становятся непредсказуемыми по мере уменьшения техпроцесса
до этого пробегала статья об уязвимости памяти DDR3 и DDR4 когда ячейки, при определеных интенсивных нагрузках "на соседей", меняют свое содержимое.
Ссылку не сохранил, но оригинал статьи называется:
Flipping Bits in MemoryWithout Accessing Them:
An Experimental Study of DRAM Disturbance Errors

.
В общем, основная парадигма цифровой техники - "любая программа запущеная сколько угодно раз с одинаковымаи входными условиями, даст неизменный результат" трещит по всем швам.

От себя добавлю - новое поколение HDD (с SMR технологией). Seagate "впереди планенты всей" - при невозможности отдать корректный сектор по причине нарушения внутренней трансляции адресов (у SMR трансляция двухуровневая), не взводит бит ошибки и выдает на шину некий постоянный паттерн, и что интересно - ненулевой (по состоянию регисторв - операция завершена успешно).
Смешались в кучу кони люди. Ну, тоесть DRAM с НЖМД А этот феномен давно на практике пользуют. Подобные атаки выделяются в класс, обозваный RowHammer. Сам как-то пользовался эксплойтом на базе этого дела, для рутовки телефона. Не так давно пролетало и еще вот такое: https://www.opennet.ru/opennew…?num=55211 Т.е. дело сие живет и развивается. И мне опять купят новые серверы
+0.00 / 0
qurvax
 
Слушатель
Карма: +8.70
Регистрация: 29.03.2017
Сообщений: 808
Читатели: 1
Очевидная логика - HDD без RAID никому не упал. Чушь на выходе конкретного диска исправит логика рейда.
Даааа? Ну есть у нас RAID1. Скраб словил разницу в данных. Который блин верный? Ась?
"Логика рейда" не про исправление чуши, а про собсно возможность чейта прочесть в принципе. Эх, реальность, бессердечная ты сука
Отредактировано: qurvax - 09 июня 2021 14:09:01
+0.02 / 1
Поверонов
 
Слушатель
Карма: +35.13
Регистрация: 05.06.2010
Сообщений: 14,364
Читатели: 8
Даааа? Ну есть у нас RAID1. Скраб словил разницу в данных. Который блин верный? Ась?
"Логика рейда" не про исправление чуши, а про собсно возможность чейта прочесть в принципе. Эх, реальность, бессердечная ты сука
При таких делах дублирования недостаточно - потребуется голосование на троих. Заодно и сбыт возрастет - вместо дублирования - утроение
+0.03 / 2
  ps_
ps_
 
Слушатель
Карма: +7.42
Регистрация: 04.04.2009
Сообщений: 3,041
Читатели: 2
При таких делах дублирования недостаточно - потребуется голосование на троих. Заодно и сбыт возрастет - вместо дублирования - утроение
Помнится мне показывали ИБМ-овский чип для сверх надежных вычислений. Там стояло два кора и КАЖДАЯ операция делалась на обоих.
Между ними стоял маленький модуль, который сравнивал результат и в случае несовпадения мог открутить назад и повторить операции, начиная с ошибочьной
+0.01 / 1
Поверонов
 
Слушатель
Карма: +35.13
Регистрация: 05.06.2010
Сообщений: 14,364
Читатели: 8
Помнится мне показывали ИБМ-овский чип для сверх надежных вычислений. Там стояло два кора и КАЖДАЯ операция делалась на обоих.
Между ними стоял маленький модуль, который сравнивал результат и в случае несовпадения мог открутить назад и повторить операции, начиная с ошибочьной
Так можно компенсировать случайную временную помеху ( типа электромагнитной наводки ) но невозможно постоянное искажение на одном из сравниваемых источников - получится бесконечный цикл сравнений
+0.00 / 0
Podli
 
Белоруссия
Минск
36 лет
Слушатель
Карма: +4.21
Регистрация: 19.03.2016
Сообщений: 729
Читатели: 0
Так можно компенсировать случайную временную помеху ( типа электромагнитной наводки ) но невозможно постоянное искажение на одном из сравниваемых источников - получится бесконечный цикл сравнений
Брак в ядре отлавливают на производстве специальными тестами. И чинят путем отключения дефектного ядра и объявлением ентого проца процом более дешевой серии с меньшим количеством ядер.
+0.01 / 1
Longspig
 
Слушатель
Карма: +16.50
Регистрация: 05.01.2014
Сообщений: 1,351
Читатели: 1
Смешались в кучу кони люди. Ну, тоесть DRAM с НЖМД А этот феномен давно на практике пользуют.
Это не "феномен". Это то - "чего не должно быть, потому что не должно быть никогда". Код моей программы может случайно совпасть с "феноменом" и начать произвольно менять содержимое памяти.
С НЖМД то же самое. Если диск выдает ложные данные, он должен взводить состояние ошибки. Рейды работают на этом принципе. Именно так определяется, какое "зеркало" содержит валидные данные. На самом "блине" данные защищены контрольными суммами и бит ошибки взводится по несовпадению КС. Но сейчас, при нарушении трансляции второго уровня, SMR-ы выдают или нули или паттерн. Как зеркальный рейд узнает, "кто прав"? Для того, у Sun был (и есть) серверный формат сектора 528 байт, т.е. сектор 512 + "сквозная" КС от хоста до харда.
.
То что творят сейчас - развитие нынешней тенденции - сперва зарезали ресурс, а теперь взялись за надежность и достоверность.
ИМАО решили принудительно "выпихивать" пользователей выносить свою инфу "в облака" (зачем!? - "а вы когда-нибудь читали чужие письма")
А потребность в дублирующем железе дает кратный прирост продаж.
+0.01 / 1
Longspig
 
Слушатель
Карма: +16.50
Регистрация: 05.01.2014
Сообщений: 1,351
Читатели: 1
Брак в ядре отлавливают на производстве специальными тестами. И чинят путем отключения дефектного ядра и объявлением ентого проца процом более дешевой серии с меньшим количеством ядер.
Так по ссылке - нынешний брак таков, что уже не ловится на производстве.
Я в жизни встретил всего один случай брака процессора (286-й AMD не проходил тест флагов регистра состояния). По DRAM случаев уйма, а вот процессоры были "островом стабильности... были...
.
- Вовочка, предложение - "я красива" это какое время?
- прошедшее, МарьВанна, прошедшее...
Отредактировано: Longspig - 10 июня 2021 12:25:47
+0.02 / 2
Podli
 
Белоруссия
Минск
36 лет
Слушатель
Карма: +4.21
Регистрация: 19.03.2016
Сообщений: 729
Читатели: 0
Так по ссылке - нынешний брак таков, что уже не ловится на производстве.
Я в жизни встретил всего один случай брака процесора (286-й AMD не проходил тест флагов регистра состояния). По DRAM случаев уйма, а вот процессоры были "островом стабильности... были...
.
- Вовочка, предложение - "я красива" это какое время?
- прошедшее, МарьВанна, прошедшее...
Хз, у нас проблемы с процессорами в разы реже, чем с памятью встречаются. Хотя и память вполне себе надежная штука, какие-либо веселости встречаются весьма редко. Процов многие тысячи, так что выборка вполне себе презентабельная. И да, я про недешевые сервера, а не про пользовательское железо.
+0.03 / 1
GrinF
 
Слушатель
Карма: +57.38
Регистрация: 15.02.2018
Сообщений: 4,051
Читатели: 1
Так можно компенсировать случайную временную помеху ( типа электромагнитной наводки ) но невозможно постоянное искажение на одном из сравниваемых источников - получится бесконечный цикл сравнений
это тоже все решаемо... булевы функции с избыточными проверочными цепями - позволяет даже с не надежными элементами добиваться надежного результата (ясен пень с какой-то вероятностью- но все фихические устройства работаю с какой-то вероятностью)
+0.00 / 0
Longspig
 
Слушатель
Карма: +16.50
Регистрация: 05.01.2014
Сообщений: 1,351
Читатели: 1
Хз, у нас проблемы с процессорами в разы реже, чем с памятью встречаются. Хотя и память вполне себе надежная штука, какие-либо веселости встречаются весьма редко. Процов многие тысячи, так что выборка вполне себе презентабельная. И да, я про недешевые сервера, а не про пользовательское железо.
Вот вряд ли Facebook бюджетное железо для своих серверов использует. Да и наличие 59-го ядра о чем-то да говорит:
Цитата
После нескольких повторений на устройстве исследователи поняли, что вычисление Int (1.1^53) в качестве входных данных для функции math.pow в Scala всегда выдаёт результат 0 на ядре 59 процессора. Когда они заменили вычисление на Int (1.1^52), программа выдала ожидаемый результат 142.
+0.03 / 1
Podli
 
Белоруссия
Минск
36 лет
Слушатель
Карма: +4.21
Регистрация: 19.03.2016
Сообщений: 729
Читатели: 0
Вот вряд ли Facebook бюджетное железо для своих серверов использует. Да и наличие 59-го ядра о чем-то да говорит:
Бывает. 100% надежности нет нигде, так что по единичным случаям начинать кричать о всепропадании всеполимеров просто глупо.
+0.00 / 0
  gvf
gvf
 
48 лет
Слушатель
Карма: +9.00
Регистрация: 06.03.2012
Сообщений: 5,775
Читатели: 6
Вот вряд ли Facebook бюджетное железо для своих серверов использует. Да и наличие 59-го ядра о чем-то да говорит:
Зависит от цены вопроса.
Гугль имеет высокую степень дублирования, чисто архитектурно, использует обычное дешевое железо, выход из строя и замена является плановыми операциями. Стоимость владения оказалась оптимальной именно в таком режиме.
Речь, понятное дело о кешах, дисках, не вычислительных ДЦ сдаваемых в аренду.
+0.07 / 4
qurvax
 
Слушатель
Карма: +8.70
Регистрация: 29.03.2017
Сообщений: 808
Читатели: 1
Помнится мне показывали ИБМ-овский чип для сверх надежных вычислений. Там стояло два кора и КАЖДАЯ операция делалась на обоих.
Между ними стоял маленький модуль, который сравнивал результат и в случае несовпадения мог открутить назад и повторить операции, начиная с ошибочьной
По уму - должно быть три, и "выборы тридвараса" путем большинства. Иначе возможна ситуация у ойтишнегов зовущаяся "сплит-брейн".
+0.03 / 1
qurvax
 
Слушатель
Карма: +8.70
Регистрация: 29.03.2017
Сообщений: 808
Читатели: 1
Это не "феномен". Это то - "чего не должно быть, потому что не должно быть никогда". Код моей программы может случайно совпасть с "феноменом" и начать произвольно менять содержимое памяти.
Это не верно. Особенности технологии говорят, что это не то что "вероятно", а вполне закономерно. Т.е. так и должно быть. Дьявол в деталях, как всегда.

С НЖМД то же самое. Если диск выдает ложные данные, он должен взводить состояние ошибки. Рейды работают на этом принципе. Именно так определяется, какое "зеркало" содержит валидные данные. На самом "блине" данные защищены контрольными суммами и бит ошибки взводится по несовпадению КС. Но сейчас, при нарушении трансляции второго уровня, SMR-ы выдают или нули или паттерн. Как зеркальный рейд узнает, "кто прав"? Для того, у Sun был (и есть) серверный формат сектора 528 байт, т.е. сектор 512 + "сквозная" КС от хоста до харда.
.

Сейчас идут путем посылки лесом рейд-контроллеров и реализации всего на софте, сo сквозной интеграцией всяких там избыточных данных на нескольких уровнях. SDS зовется. Венда умеет. Storage Spaces и ReFS именно про это вот все.
+0.03 / 1
  ps_
ps_
 
Слушатель
Карма: +7.42
Регистрация: 04.04.2009
Сообщений: 3,041
Читатели: 2
По уму - должно быть три, и "выборы тридвараса" путем большинства. Иначе возможна ситуация у ойтишнегов зовущаяся "сплит-брейн".
Я говорю про то, что лично видел.
Это был конец 90-х и может быть три ядра было тяжело делать.

Там говорилось, что то по поводу финансовых вычислений и если процессоры полностью запутались, то самое надежное - это совсем остановить машину, чем считать неизвестно что Подмигивающий
+0.05 / 2
  •  2 
  •  3 
  • След→

НОВОСТИ ПАРТНЕРОВ