The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Опубликована платформа SEF для программно управляемых Flash-накопителей, opennews (??), 12-Дек-23, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


45. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (-), 13-Дек-23, 12:01 
> который отправляет zfs и прочие ненужные усложнённые фс на свалку истории

Глядя на то как btrfs запилил поддержку Zoned - на минуточку, это почти ответка к тому интерфейсу уже и есть :))

Если что - Zoned применяется в том числе и флешовыми девайсами как более тонкий уровень в контроллере, где ФС/ОС явно в курсе что у накопителя есть регионы, в которые можно только последовательную запись, а чтобы перезаписать - надо очистить зону. Это так то представление семантики операций Erase/Program флеша через довольно тонкий уровень ремапа, хотя черепице тоже подошло.

Ответить | Правка | Наверх | Cообщить модератору

54. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (8), 13-Дек-23, 14:14 
> Это так то представление семантики операций Erase/Program флеша через довольно тонкий уровень ремапа

в btrfs cow само по себе прекрасно ложится на флеши - запись всегда в новую область последовательно а вот всякие виртуальные устройства с разным приоритетом и контрольные суммы - нафиг не нужны в фс, SEF всё сделает

Ответить | Правка | Наверх | Cообщить модератору

66. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (66), 13-Дек-23, 17:09 
> в btrfs cow само по себе прекрасно ложится на флеши - запись
> всегда в новую область последовательно а вот всякие виртуальные устройства с
> разным приоритетом и контрольные суммы - нафиг не нужны в фс,
> SEF всё сделает

В случае btrfs чексуммы дают дополнительные возможности. Скажем, копий может быть и 2 (или даже 3 или 4!) - и при факапе чексуммы можно еще и закопировать блок с другого устройства. Сделав SelfHeal. А как вы чексуммами вон там что-то такое организуете? Вы же не можете на том уровне уповать что девайсов в системе гарантированно 2 или более? Это только вон там ФС знает, можно так было в конкретной системе - или нет.

И прочие RAID и ко - в ФС все же лучше делаются: можно динамически отращивать или уменьшать емкость, прям на ходу, добавлением или выниманием девайса. Иногда таки удобно.

Ответить | Правка | Наверх | Cообщить модератору

70. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (8), 13-Дек-23, 18:40 
> В случае btrfs чексуммы дают дополнительные возможности. Скажем, копий может быть и 2 (или даже 3 или 4!) - и при факапе чексуммы можно еще и закопировать блок с другого устройства.

а смысл держать 4 копии в одном месте - есть распределённые фс, а так у тебя электричество кончится и ни одной не прочитаешь

> можно динамически отращивать или уменьшать емкость, прям на ходу, добавлением или выниманием девайса.

с SEF скорей всего так тоже можно иначе в чём смыл его "гипермасштабируемости"

Ответить | Правка | Наверх | Cообщить модератору

78. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (-), 13-Дек-23, 21:57 
> а смысл держать 4 копии в одном месте - есть распределённые фс,
> а так у тебя электричество кончится и ни одной не прочитаешь

Ну например если есть >=4 накопителя, можно метаданные для надежности как RAID1C4 а данные что попроще, из соображений что разлет метаданных делает все сильно сложнее.

А делать вот именно распределенные структуры - это весьма нишевое и специальное знание. Особенно в не слишком дурном виде. И это все же другой уровень сложности и компетенции. Я в чем-то согласен что вон то несколько нишевой случай, но если его сделали, значит это было кому-то нужно.

> с SEF скорей всего так тоже можно иначе в чём смыл его
> "гипермасштабируемости"

Он что, будет знать что я пристыковал еще энные девайсы хочу вон ту или вот эту ФС туда расширить? Не очень понимаю как такое знание должно транслироваться на ТОТ уровень. Как это в ФС выглядит - это как раз понятно. "device add -> +N места". Менеджмент систем как он должен был быть с самого начала.

Ответить | Правка | Наверх | Cообщить модератору

82. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (8), 14-Дек-23, 08:14 
>  Не очень понимаю как такое знание должно транслироваться на ТОТ уровень. Как это в ФС выглядит - это как раз понятно. "device add -> +N места".

не понимаю в чём сложность что диск стал больше - воткнули новый диск, через cli-утилиту сказали sef-у вон от того диска приплюсуй вон к тому, тому, тому логическим, resize налету даже ext4 поддерживает

Ответить | Правка | Наверх | Cообщить модератору

120. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (-), 17-Дек-23, 22:55 
>>  Не очень понимаю как такое знание должно транслироваться на ТОТ уровень.
>> Как это в ФС выглядит - это как раз понятно. "device add -> +N места".
> не понимаю в чём сложность что диск стал больше - воткнули новый
> диск, через cli-утилиту сказали sef-у вон от того диска приплюсуй вон
> к тому, тому, тому логическим, resize налету даже ext4 поддерживает

А данные с старого диска на новый - телепортируются? А оба диска на пару как 1 стораж? У вон тех то - "btrfs device add <what>" -> +N места в ФС. Можно и device remove, удвинет используемые данные (а не всю площадь) и можно вынуть девайс.

При том - это еще и с RAID работает. Если есть девайсы на 2, 3 и 5 терабайт, это вполне сделает RAID1 cуммарным размером около 5 терабайтов. А вы так смогете? :)

...та штука врядли в курсе таких чудес инженерии и менеджмента. BigPic - не ее уровень.

Ответить | Правка | Наверх | Cообщить модератору

130. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (8), 18-Дек-23, 23:44 
> А данные с старого диска на новый - телепортируются? А оба диска на пару как 1 стораж?

во первых зачем телепортировать - устройства логические, ты LBA видишь снаружи, полдиска логического с одного массива нанды вторая половина с другого да и p2p dma на pcie есть

Ответить | Правка | Наверх | Cообщить модератору

131. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (-), 19-Дек-23, 01:14 
>> А данные с старого диска на новый - телепортируются? А оба диска на пару как 1 стораж?
> во первых зачем телепортировать -

Есть минимум 3 причины закопировать или переместить данные на другой накопитель:
1) Если старый девайс хочется вынуть из системы, т.е. "замена".
2) Load balancing.
3) Redundancy.

> устройства логические, ты LBA видишь снаружи, полдиска логического с одного
> массива нанды вторая половина с другого да и p2p dma на pcie есть

И - чего? Это никак не адресует load balancing, миграцию данных, избыточность, изъятие накопителя с данными из системы, замену девайса на другой. Вполне обычные хотелки системного менеджмента. А заодно можно и - вот - продвинутости. Не сошелся чексум при чтении? SELF HEAL! Берется блок с другой копии. Пишется в проблемный стораж заново. Если это изредка - ну и отлично, избыточность восстановлена. Если часто - окей, сигнал что глюкастик пора менять.

Так что это врядли замена вон тому. Фичесет сильно разный и уровни абстракции не те. Но вот какой zoned mode файлух и cow может на это неплохо пристроиться, видимо.

Ответить | Правка | Наверх | Cообщить модератору

133. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (8), 19-Дек-23, 01:37 
> И - чего? Это никак не адресует load balancing, миграцию данных, избыточность, изъятие накопителя с данными из системы, замену девайса на другой.

последний абзац новости намекает что всё это есть, мне лень погружаться

Ответить | Правка | Наверх | Cообщить модератору

99. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (96), 14-Дек-23, 22:08 
> в btrfs cow само по себе прекрасно ложится на флеши

На голые флеши его класть нельзя, flash translation layer для выравнивания износа всё ещё нужен, поэтому толк от последовательной записи (в смысле дружбы с флешами)... только в более лёгкой адаптации под ZNS?

Насколько оно вообще хорошо ложится, показывает величина write amplification и у CoW ФС она больше, чем у других (может, из-за обычных для них наворотов типа дублирования метаданных). Для хорошего укладывания надо разделить потоки записи, тут или ZNS поможет, или, теоретически, не-CoW ФС, где у контроллера SSD остаётся подсказка, где данные горячие, а где холодные, чтобы их не смешивать в одном блоке.

Ответить | Правка | К родителю #54 | Наверх | Cообщить модератору

101. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (8), 15-Дек-23, 10:21 
> Насколько оно вообще хорошо ложится, показывает величина write amplification и у CoW ФС она больше, чем у других (может, из-за обычных для них наворотов типа дублирования метаданных).

дело не в cow а в том что монстрофс с cow хранят снапшоты - для пользователя кажется что диск наполовину занят а для контроллера диск забит под завязку, он в фоне перекидывает занятые блоки на новое место для выравнивания износа, это эквивалентно как если фс не поддерживает TRIM

Ответить | Правка | Наверх | Cообщить модератору

102. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (96), 15-Дек-23, 11:52 
> дело не в cow а в том что монстрофс с cow хранят снапшоты

Нет, это дело ещё более опциональное, чем дублирование метаданных, а коровья сущность всё-таки на write amplification влияет.

Ответить | Правка | Наверх | Cообщить модератору

103. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (8), 15-Дек-23, 12:48 
> а коровья сущность всё-таки на write amplification влияет

только в лучшую сторону, например специальная фс для nand ubifs - спроектирована по заказу Nokia, дураки наверно проектировали с cow :)

Ответить | Правка | Наверх | Cообщить модератору

105. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (96), 15-Дек-23, 22:10 
Я с обобщениями ещё вот где напортачил. Write amplification на практике могут определять как
1. объём записи непосредственно во флеш-память, поделённый на объём записи с хоста на SSD (чаще).
2. оверхед файловой системы, без погружения ниже логических адресов (реже).
И это будут два совсем разных результата (и потенциальный третий, если кто-то объединяет обе величины).

> только в лучшую сторону, например специальная фс для nand ubifs - спроектирована
> по заказу Nokia, дураки наверно проектировали с cow :)

F2FS - более подходящий пример, она в тех же условиях, что и btrfs (не работает с сырым флешем). Про разницу в оверхеде между ними (во втором смысле) пишут так:
"In contrast, btrfs has a complex implementation of the copy-on-write technique (mostly due to a push to provide more features such as snapshots and stronger data integrity) that leads to extremely high space and write amplification" [1]

Ещё там, оказывается, есть приёмы для разделения горячих и холодных данных, контроллер их как-то понимает.
"six major log areas to maximize the effect of hot and cold data separation" [2]

[1] https://arxiv.org/pdf/1707.08514.pdf#page=3
[2] https://www.usenix.org/system/files/conference/fast15/fast15...

Ответить | Правка | Наверх | Cообщить модератору

106. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (8), 16-Дек-23, 11:38 
> Ещё там, оказывается, есть приёмы для разделения горячих и холодных данных, контроллер их как-то понимает.

тоже мне бином ньютона - что мешает считать обращения к логическим блокам а не только к физическим, горячие логические блоки размещают в SLC как вариант - у них ресурс на порядки больше

Ответить | Правка | Наверх | Cообщить модератору

111. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от torvn77 (ok), 16-Дек-23, 22:33 
> и контрольные суммы - нафиг не нужны в фс,
> SEF всё сделает

Не согласен, очень удобно когда ФС знает что и как прочиталось и может сама откорректировать ошибку.

Ответить | Правка | К родителю #54 | Наверх | Cообщить модератору

114. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (8), 17-Дек-23, 11:31 
> очень удобно когда ФС знает что и как прочиталось и может сама откорректировать ошибку

можешь взять результат ECC у контроллера да и zfs ошибки не корректирует - тебя кто-то обманул

Ответить | Правка | Наверх | Cообщить модератору

115. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от torvn77 (ok), 17-Дек-23, 11:55 
>> очень удобно когда ФС знает что и как прочиталось и может сама откорректировать ошибку
> можешь взять результат ECC у контроллера да и zfs ошибки не корректирует
> - тебя кто-то обманул

Ты о разных версиях zraid забыл.  
Ну и в любом случае,
1. выявление факта порчи хорошо само по себе.  
2. подсчёт хешсуммы надёжнее проверки чётности

Ответить | Правка | Наверх | Cообщить модератору

116. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (8), 17-Дек-23, 13:43 
zfs не корректирует ошибки, она другую копию может дать но для этого надо диск в два раза больше и похорошему надо на разных дисках хранить и на разных компьютерах
Ответить | Правка | Наверх | Cообщить модератору

117. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от torvn77 (ok), 17-Дек-23, 21:50 
> zfs не корректирует ошибки, она другую копию может дать но для этого
> надо диск в два раза больше и похорошему надо на разных
> дисках хранить и на разных компьютерах

Может откоректировать через исключающее ИЛИ

Ответить | Правка | Наверх | Cообщить модератору

127. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (8), 18-Дек-23, 12:40 
Она может взять избыточную копию если она есть или у раида запросить если он есть пересобрать копию c учётом чойтности, контольная сумма для определения ошибки а не для корреции.
Ответить | Правка | Наверх | Cообщить модератору

128. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от torvn77 (ok), 18-Дек-23, 16:36 
> Она может взять избыточную копию если она есть или у раида запросить
> если он есть пересобрать копию c учётом чойтности, контольная сумма для
> определения ошибки а не для корреции.

Контрольная сумма нужна чтобы понять что блок имеет повреждение, а потом чтобы понять что он восстановился правильно, а не так чтоб чётность восстановилась.  
(в отличии от хешсум проверка чётности вообще может пропустить ошибку если повредились два бита)

Ответить | Правка | Наверх | Cообщить модератору

129. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (8), 18-Дек-23, 17:53 
> в отличии от хешсум проверка чётности вообще может пропустить ошибку если повредились два бита

сколько можно восстановить зависит от алгоритма FEC и количества избыточной информации, сомневаюсь что кто-то код Хэминга сейчас использует - RS, BCH, LDPC и др. В nand есть отдельные области для хранения избыточной информации, какие алгоритмы используются зависит от производителя контроллеров, в sef есть и раиды свои и копии избыточные не только zfs умеет хранить да и контрольные суммы тоже.

Ответить | Правка | Наверх | Cообщить модератору

132. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (-), 19-Дек-23, 01:22 
> сколько можно восстановить зависит от алгоритма FEC и количества избыточной информации,
> сомневаюсь что кто-то код Хэминга сейчас использует - RS, BCH, LDPC и др.

А RAID1 какой - очень полезен на тот случай если это не прокатило, или девайс взял да и сдох совсем. В случае чексумм возможен продвинутый уровень - понять какая из копий при этом еще и правильная, и из нее починить вторую. Во всяком случае на btrfs оно вот так работает - и для флешатины почему-то сейчас очень модно выгружать наружу битые блоки не репортя IO error. И толку вам с их BCH или чего там - если оно вот так в результате?

> В nand есть отдельные области для хранения избыточной информации,
> какие алгоритмы используются зависит от производителя контроллеров, в sef есть и
> раиды свои и копии избыточные не только zfs умеет хранить да
> и контрольные суммы тоже.

Врядли SEF сможет в управление девайсами того уровня... и да, снапшоты и проч - тоже полезные фичи, особенно на системном диске. Можно при факапе вместо реинстала системы полдня откатить все как было за 2 минуты и попробовать еще раз. Почти как на виртуалке - только на bare metal. Вон то не адресует этот аспект. А лепить это из этажерок типа LVM - оно получается хреновое, сложное, горбато работает и - менеджмент ужасен.

Ответить | Правка | Наверх | Cообщить модератору

134. "Опубликована платформа SEF для программно управляемых Flash-..."  +/
Сообщение от Аноним (8), 19-Дек-23, 02:05 
> А RAID1 какой - очень полезен на тот случай если это не прокатило, или девайс взял да и сдох совсем.

про код Хэмминга я имел ввиду не используют в nand - сейчас в ходу tlc qlc с огромным количество ошибок, в slc он может ещё был актуален

>  Можно при факапе вместо реинстала системы полдня откатить все как было за 2 минуты и попробовать еще раз.

что за мифические факапы - диск помрёт и никакие снапшоты не помогут. Я своё рабочее окружение могу в любой точке мира создать с нуля, главное чтобы инет был.

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру