forum.opennet.ru - "Использование в FFmpeg инструкций AVX-512 позволило в 94 раза ускорить некоторые операции" (140)

"Использование в FFmpeg инструкций AVX-512 позволило в 94 раза ускорить некоторые операции"

Форум Разговоры, обсуждение новостей
Вариант для распечатки		Пред. тема \| След. тема
Изначальное сообщение		[ Отслеживать ]

"Использование в FFmpeg инструкций AVX-512 позволило в 94 раза ускорить некоторые операции"	+/–
Сообщение от opennews (?), 05-Ноя-24, 11:03
Разработчики проекта FFmpeg сообщили о реализации новых ассемблерных оптимизаций, в которых, благодаря применению инструкций AVX-512, удалось ускорить некоторые операции, применяемые при декодировании видео, в 94, 64, 43 и 4.24 раза по сравнению с кодом на языке Си. В оптимизациях на базе инструкций AVX-2 прирост по сравнению с Си-кодом составлял 67, 27, 55 и 4.38 раз, соответственно, а на основе инструкций SSSE3 - 40, 21, 29 и 2.49 раз. Изменения добавлены в состав библиотеки dav1d, предлагающей альтернативный декодировщик для формата кодирования видео AV1. Инструкции AVX-512 доступны в процессорах AMD на базе микроархитектур Zen 4 и 5, и в процессорах Intel на базе таких микроархитектур, как Skylake-X, Ice Lake, Tiger Lake и Rocket Lake... Подробнее: https://www.opennet.ru/opennews/art.shtml?num=62177
Ответить \| Правка \| Cообщить модератору

Оглавление

Молодцы Вот есть же разработчики, которые кроме обвеса плюшками и раскабанивани, Мохнонос (?), 11:03 , 05-Ноя-24, (1) +48

AVX512 инструкции появились в 2016 году 8 лет назад внимание вопрос Это так дол, Аноним (31), 13:24 , 05-Ноя-24, (31) –22

когда тебе денег за работу не платят, то выбираешь сам когда и что делать по мер, Аноним (34), 13:29 , 05-Ноя-24, (34) +24

Справедливо Интел должна доплачивать чтобы кто-то юзал их лишние инструкции , Аноним (31), 13:31 , 05-Ноя-24, (36) +2

Так интел уже официально не поддерживает AVX-512 , Юрий (??), 13:49 , 05-Ноя-24, (41) +1

А что так Не взлетело , Аноним (49), 14:43 , 05-Ноя-24, (49) +1

AVX-512 не реализовали в E-ядрах, поэтому интел инструкции отключил для всех пот, Аноним (65), 16:03 , 05-Ноя-24, (65) +5

Неужели не смогли с M договориться, чтобы помечать процессы, требующие avx512 и, Аноним (113), 03:24 , 06-Ноя-24, (113) +1

Скорей похоже на залочку маркетингово , Аноним (117), 10:44 , 06-Ноя-24, (117) +3
Механизм может периодически ошибаться с вылетами приложений Покупатели могут сл, Аноним (65), 22:12 , 06-Ноя-24, (140)

А про официально не поддерживает можно подробнее Ну там ссылку на заявление Инт, Фняк (?), 21:41 , 05-Ноя-24, (95)

В серверных процессорах очевидно, что они есть и будут и войдут в AVX10 1 512 , Аноним (65), 02:24 , 06-Ноя-24, (109)

в прошлом майкрософт доплачивала, чтобы винду везде ставили и вот результат, Соль земли (?), 17:55 , 05-Ноя-24, (80) –1

Думаю и Intel и прочие, просто у первой раз в 1000 денег больше даже чем у AMD, , Аноним (117), 10:46 , 06-Ноя-24, (118) +1

Ты думаешь что все пользователи и все сервера сразу же в 2016 году обновились на, Anony (?), 13:40 , 05-Ноя-24, (39) +6

Массовыми такие процессоры стали далеко не в 2016 А когда стали появляться, Inte, Аноним (43), 14:23 , 05-Ноя-24, (43) +1
Под сокет АМ5 завезли А раз они есть, то надо их использовать Зря чтоли апгрейд, Вертел ваши спинеры (?), 15:07 , 05-Ноя-24, (56) +8
Не находишь орным что сабж реализовали после деприкейта avx512 , Аноним (31), 23:50 , 05-Ноя-24, (101) +1

То, что его депрекетнул идущий ко дну Интел - исключительно его проблемы AMD по, Аноним (134), 19:28 , 06-Ноя-24, (134) +1

Arrow Lake от следующих слов лучше, конечно, не станет, но Mindfactory - это воо, Аноним (65), 21:54 , 06-Ноя-24, (139)

На 12400 попытались появиться, но интел быстренько резанули это дело А проц 22-, Аноним (40), 13:49 , 05-Ноя-24, (40) +2
Не, чувак, тут вопросы к чипмейкерам Я очень хотел проц с AVX512 а интел только , Ivan_83 (ok), 14:25 , 05-Ноя-24, (45) +3

Даже спрашивать страшно где ты там на своей фряхе используешь avx А я даже и сп, Аноним (31), 23:53 , 05-Ноя-24, (102)
Intel Core 2 Duo - это и SSE4 1 , Аноним (-), 10:18 , 07-Ноя-24, (142)

Не все , Аноним (148), 13:41 , 07-Ноя-24, (148)

8 лет в контексте x86 это буквально вчера Жизненный цикл процессора может быть , laindono (ok), 16:43 , 05-Ноя-24, (69) +1

У интела жизненный цикл проца 1-2 года, как и платформы За 10 лет интел сменил ц, Ivan_83 (ok), 17:25 , 05-Ноя-24, (78)

Вопрос не в том, как часто обновы появляются, а как быстро старые уходят из упот, laindono (ok), 18:03 , 05-Ноя-24, (83) +1

Смартфоны часто оборачиваются не из за процов а просто потому что экран или бата, Ivan_83 (ok), 18:13 , 05-Ноя-24, (85)

Случайно вышло, вот, полгода потом проц выгорает нахрен Народ не оценил и ак, Аноним (-), 23:02 , 05-Ноя-24, (98)

Инструкции-то были, но были только в интелах где от них включался тротлинг по ча, mr. cake (?), 19:19 , 05-Ноя-24, (89)
Инструкции то появились ну где то А когда они появились на твоём столе , Кирилл (??), 19:58 , 05-Ноя-24, (90) +1
AV1 был впервые опубликован 28 марта 2018, то есть 6,5 лет назад Это все-таки м, Аноним (92), 20:46 , 05-Ноя-24, (92) –1
Тебе никто не обязан этого делать Ребята сделали, почёт им , 1 (??), 18:04 , 06-Ноя-24, (128)

Ассемблер стреляет тогда - когда этого никто не ждёт 128527 128527 128527 , dim4k (ok), 11:04 , 05-Ноя-24, (3) +11

Осталось только найти что конкретно сломали, лол, КО (?), 12:09 , 05-Ноя-24, (16) +1
Нужно было писать на Java, там же волшебный jit который сам весь код оптимизируе, Ник (??), 12:18 , 05-Ноя-24, (19) +1

Он и оптимизирует волшебный жор проца и оперативы Станет жрать RAM и CPU в разы, Аноним (-), 23:03 , 05-Ноя-24, (99) +1

Avx всё так же режет частоту процессора Кто-нибудь уже составил сравнительную т, Аноним (4), 11:06 , 05-Ноя-24, (4) +2

Вроде как, урезание частот при включенном AVX относилось только к ранним моделям, dalco (ok), 11:13 , 05-Ноя-24, (7)

Они там повторяли с каждым новым avx , Аноним (4), 11:17 , 05-Ноя-24, (10) +2

В моих реализациях для AVX2, с использованием fixed-point арифметики, какой либо, Cykooz (ok), 11:25 , 05-Ноя-24, (11) +8

Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..., ryoken (ok), 12:31 , 05-Ноя-24, (21) –3

Может быть, он даже не ошибся Называют же, например, реализацию преобразования , Аноним (27), 12:42 , 05-Ноя-24, (27) +3

ошибся, ибо то что он описал это тупо замена последовательных вычислений на пара, Аноним (60), 15:35 , 05-Ноя-24, (60) –1

Под наивной я имел ввиду без ассемблера и без вызова разных интринсиков Исклю, Cykooz (ok), 15:54 , 05-Ноя-24, (64) +2

думаю, уместно было бы написать нативной простой реализацией на float-ах и он, Аноним (60), 16:24 , 05-Ноя-24, (68)
Можно ли объединить подходы с использованием fixed-point и расширений SSE2 Возм, Аноним (154), 08:30 , 08-Ноя-24, (154)

Если он будет более энергоэффективным, то он не будет такой же производительный , Cykooz (ok), 17:04 , 08-Ноя-24, (157)

Это из-за снижения частоты процессора с ростом потоков У меня в однопотоке тако, НяшМяш (ok), 14:31 , 05-Ноя-24, (47)

У него АМД, вряд ли просадка с 4 до 3,4 даст заметное проседание скорости, а ниж, Ivan_83 (ok), 14:49 , 05-Ноя-24, (53) +2
Поправку надо сделать Я не внимательно посмотрел, не один процессор 128 ядер, а, Аноним (-), 11:35 , 07-Ноя-24, (144)
Скрыто модератором, Аноним (-), 11:35 , 07-Ноя-24, (145)

Лучше в 1 потоке в 8 раз быстрее считать, чем в 8 потоках с той же скоростью , Аноним (48), 14:34 , 05-Ноя-24, (48)

Не совсем так, мультипоток даёт прирост скорости даже при использовании SIMD Пр, Cykooz (ok), 16:04 , 05-Ноя-24, (66)

Таки ничего удивительного, учитывая что AVX позволяет более плотно загружать ИМЕ, Ivan_83 (ok), 14:45 , 05-Ноя-24, (50)
Поправку надо сделать Я не внимательно посмотрел, не один процессор 128 ядер, а, Аноним (-), 11:39 , 07-Ноя-24, (146)

На нормальных материнских платах можно регулировать оффсет частоты при выполнени, Аноним (22), 12:33 , 05-Ноя-24, (22)
Сам по себе AVX на частоту не влияет никак Частота снижается по средствам сторо, Аноним (73), 17:13 , 05-Ноя-24, (73)
Я когда читал ваш тред, у меня рука от лица не отлипала Это надо же было не толь, Аноним (152), 05:02 , 08-Ноя-24, (152) –1

Так это придумали еще 20 лет назад, до появления троттлинга процессоры просто сг, Аноним (134), 14:01 , 08-Ноя-24, (156)

Время перекодирования или только некоторые операции Ps и сравнение не с пр, _kp (ok), 11:14 , 05-Ноя-24, (8) +5

Судя по скрину - некоторые операции которые являются по сути базовыми для опе, Андрей (??), 11:32 , 05-Ноя-24, (12)
Отдельные функции Сравнили с тем, что использовалось до этого , Аноним (14), 11:54 , 05-Ноя-24, (14)

Вроде бы удаляли эти инструкции, но вообще интересно, для каких именно разработч, Big Robert TheTables (?), 11:50 , 05-Ноя-24, (13) –1

Нет, мы взяли котёнка по кличке ядро , у которого есть дверцы разного размера , Аноним (65), 12:22 , 05-Ноя-24, (20) –1

Поэтому компания Интел и находится на грани банкротства с убытками 16 миллиардов, Аноним (31), 13:28 , 05-Ноя-24, (33) +2

Не поэтому С тем же успехом можно сказануть, что у него хардварные кодеки лучш, Аноним (65), 14:18 , 05-Ноя-24, (42)
Из за этого покупатели не разбегаются А вот, скоропортящиеся лотерейные процесор, _kp (ok), 15:29 , 05-Ноя-24, (59) +1

Проблемы у Intel начались задолго до фиаско с 13 14 поколением , Аноним (14), 19:05 , 05-Ноя-24, (86)

ссылку бы дать на квартальный финансовый отчет, Аноним (60), 15:38 , 05-Ноя-24, (62) –1

На 3dnews ru были новости, но там Интел писала, что это в основном разовые убытк, Tita_M (ok), 17:02 , 05-Ноя-24, (72)

интел писала на 3dnews ru , Аноним (60), 01:22 , 06-Ноя-24, (108) +1
Вот если интересно, аноним выше непонимает разницы между расходом ускоренной ам, Аноним (60), 02:41 , 06-Ноя-24, (110)

Ускоренная амортизация это такой же бред как отрицательный рост Забавно это сл, Аноним (31), 11:21 , 06-Ноя-24, (120)

банкрот, убытки, звон и вечерний му звон, доонссылку на подачу заявления о банк, Аноним (60), 13:51 , 06-Ноя-24, (122)

А зачем тебе ссылка У анонима написано на грани , не более Ты придумал о пода, Аноним (134), 17:21 , 08-Ноя-24, (158)

помесячный графикhttps ycharts com companies INTC net_income, Аноним (60), 03:15 , 06-Ноя-24, (111)

Типа ты не верил в убытки или сам себе пытаешься доказать что у Интел все хорошо, Аноним (31), 11:21 , 06-Ноя-24, (121)

пену у рта протри, и балон с водой слей в канаву, а после пойми разницу между оп, Аноним (60), 13:54 , 06-Ноя-24, (123)

Убыток 8212 отрицательная разница между полученными доходами и произведенными, Аноним (134), 17:26 , 08-Ноя-24, (159)

Квартал ни о чём не говорит Один может быть сильно более убыточный, другой - си, Бывалый Смузихлёб (ok), 18:02 , 05-Ноя-24, (82)
Копейки, тем более они в фабы вложились Интел too big to fail, надо будет, вклю, Аноним (4), 23:06 , 05-Ноя-24, (100)

И получишь очередные Жигули , Аноним (31), 23:59 , 05-Ноя-24, (104)

К сожалению, тут не котят в дверцы надо просунуть, но данные а подготовить, б , Big Robert TheTables (?), 15:15 , 06-Ноя-24, (125) –1

Конечно сложнее, дверцы находятся внутри котят , Аноним (65), 19:24 , 06-Ноя-24, (133)
Когда в Интернете переходят на вы , в реальности давно бьют морду Меня тоже с, Аноним (65), 22:36 , 06-Ноя-24, (141)

Согласен, не работал в Intel или Эльбрусе Байкале, но это логично Поговорить у , Big Robert TheTables (?), 13:41 , 07-Ноя-24, (149)

Чует моё сердце, что тут 100 пудово есть какой-нить нюанс , типа всё делаем в о, Аноним (17), 12:10 , 05-Ноя-24, (17) +1

Нюанс в том что не везде он теперь будет работать , Rodegast (ok), 13:31 , 05-Ноя-24, (37)

Я надеюсь они пользовались GNU assembler с синтаксисом AT T , Аноним (26), 12:42 , 05-Ноя-24, (26)

Надеюсь, с синтаксисом Intel , Аноним (27), 12:51 , 05-Ноя-24, (30) +4

Надеюсь на раст , Аноним (31), 13:30 , 05-Ноя-24, (35)

На Rust надейся, а сам не плошай , Аноним (27), 14:23 , 05-Ноя-24, (44) +1
Не надейтесь Там ассемблер Но и не расстраивайтесь Для раста много ниш открыв, Аноним (52), 14:49 , 05-Ноя-24, (52)

По факту это питон всех заменяет и вырвался на первое место по частоте использов, Аноним (48), 15:21 , 05-Ноя-24, (58)

Так, это не осилили просто что то серьёзнее Вот на дорогах каких машин больше BM, _kp (ok), 15:35 , 05-Ноя-24, (61) –1

В Германии БМВ сильно больше Сказать то чего хотел Что в нормальных странах вы, Аноним (31), 00:01 , 06-Ноя-24, (105) +2

частота использования может указывать и на г0вно И не только про авто вне Гер, _kp (ok), 11:20 , 06-Ноя-24, (119)

Фух, интеловский синтаксис, NASM https code videolan org videolan dav1d - blob, Аноним (65), 17:31 , 05-Ноя-24, (79)

А вам не всё равно , Аноним (14), 19:08 , 05-Ноя-24, (87) +1

Зачем бы я тогда искал От факта использования интеловского синтаксиса есть неко, Аноним (65), 20:31 , 05-Ноя-24, (91)
Не всё равно , 1001й глаз (?), 22:18 , 05-Ноя-24, (96)

Ага, каталог blob у проекта, которое не относится к проекту ffmpeg , Аноним (-), 06:41 , 06-Ноя-24, (114)

Угу, умные комментарии на опеннете Это часть гитхлабовских URL, алло 1 О том, , Аноним (65), 21:27 , 06-Ноя-24, (137)

кхм а скомпилировать из си с использование указанных инструкций , Аноним (29), 12:50 , 05-Ноя-24, (29)

А компилятор смогёт - , BeLord (ok), 13:26 , 05-Ноя-24, (32) +1

А в чём проблема , Аноним (97), 22:51 , 05-Ноя-24, (97)

В неумении эксперта задать ключ -S транслятору , n00by (ok), 10:32 , 06-Ноя-24, (116)

На AVX2 главное не сильно хуже получилось , Ivan_83 (ok), 14:29 , 05-Ноя-24, (46) +1

по логике avx512 должен быть в 256 раз быстрее avx2, но intel и тут облажались, 12yoexpert (ok), 17:18 , 05-Ноя-24, (75) +2

У интела с неймингом традиционно плохо , Ivan_83 (ok), 17:22 , 05-Ноя-24, (77)
В 100500 же ж , Аноним (14), 19:09 , 05-Ноя-24, (88)

Представил себе качество базовой реализации , Аноним (52), 14:47 , 05-Ноя-24, (51)

Рассуждать о качестве тут вообще не к месту Правильнее называть это не базовой р, Аноним (55), 15:05 , 05-Ноя-24, (55) +1
А что там представлять Там видимо какая то простая операция, типа сложить однин , Ivan_83 (ok), 15:49 , 05-Ноя-24, (63) +1

Я не понимаю что на Opennet делают настолько необразованные люди Которые не зна, Аноним (55), 16:06 , 05-Ноя-24, (67)

Intrinsics are just C-style functions that do something with these vector data t, Аноним (60), 16:57 , 05-Ноя-24, (70)
Вы бы читать научились ОБЫЧНО на С не используют такие штуки, в том числе и инст, Ivan_83 (ok), 17:20 , 05-Ноя-24, (76) +1

Что значит обычно Это как-то связано с тем что 99 случаев никто код не оптимиз, Аноним (55), 16:22 , 06-Ноя-24, (126)

а разве есть разница , Аноним (60), 17:48 , 06-Ноя-24, (127)

Разница в чём В производительности будет одно и то же Если вы не мега-эксперт , Аноним (55), 18:14 , 06-Ноя-24, (130)

то есть я пишу на С и пихаю асм вставки векторных инструкций и мне надо будет за, Аноним (60), 18:31 , 06-Ноя-24, (131)

Где в процитированный для виду википедии написано что интринсики это асм вставки, Аноним (55), 19:48 , 06-Ноя-24, (135)

вам теперь скинуть ссылку на определение built-in function , Аноним (60), 21:27 , 06-Ноя-24, (138)

Чтобы оптимизировать код не обязательно опускатся на низкий уровень и писать инс, Ivan_83 (ok), 20:43 , 06-Ноя-24, (136)

Ужасно желтушный заголовок, потому что сравнивать надо не с Си, а с оптимизацией, Аноним (55), 14:55 , 05-Ноя-24, (54) +4

Скорее всего сравнивают то, что успели накодить для теста Так то можно и Си зас, Соль земли (?), 18:01 , 05-Ноя-24, (81)

Не, всё написано, последнее изменение полгода назад, почти сплошной асм отдельны, Аноним (65), 18:12 , 05-Ноя-24, (84)

Базовые реализации у всех тестов кроме первого совсем медленные, может, вместо у, Аноним (71), 16:59 , 05-Ноя-24, (71)

Очень похоже на то https news ycombinator com item id 42042706Но не совсем, у, Аноним (129), 18:10 , 06-Ноя-24, (129)

Еще бы найти где-то видео в формате AV1 , Аноним (92), 20:51 , 05-Ноя-24, (93)

Уже давно YouTube и русские сервера с видео поставляют его Смотрите техническую, Аноним (94), 21:35 , 05-Ноя-24, (94) +2

Не надо так , Аноним (31), 00:02 , 06-Ноя-24, (106) –1

Мне больше интересно насколько с AVX512 производительнее чем с AVX256 и стоит ли, Ilya Indigo (ok), 07:22 , 06-Ноя-24, (115)

См тему про тестирование cpu в ffmpeg на форуме ixbt Если коротко, бывает даёт, anon111 (?), 14:16 , 06-Ноя-24, (124)

А потом говорят, что Сишка быстрая , Bottle (?), 19:18 , 06-Ноя-24, (132)

Сишка не исполняется, Аноним (147), 12:57 , 07-Ноя-24, (147)

Работают ли эти оптимизации на aarch64 , Аноним (152), 05:08 , 08-Ноя-24, (153)

Нет кончено, это не для армов , Аноним (155), 13:05 , 08-Ноя-24, (155)

Сообщения [Сортировка по времени | RSS]

1. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +48 +/–

Сообщение от Мохнонос (?), 05-Ноя-24, 11:03

Молодцы! Вот есть же разработчики, которые кроме обвеса плюшками и раскабанивания ПО ведут его непосредственную тщательную полировку

Ответить | Правка | Наверх | Cообщить модератору

31. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." –22 +/–

Сообщение от Аноним (31), 05-Ноя-24, 13:24

AVX512 инструкции появились в 2016 году 8 лет назад внимание вопрос. Это так долго до разработчиков доходила весть что инструкции появились? Они так долго копили на проц с поддержкой данных инструкций? Они 8 лет разрабатывали алгоритм? Ответ на любой вопрос показывает что разрабы у ффмпег не очень скажем так.

Ответить | Правка | Наверх | Cообщить модератору

34. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +24 +/–

Сообщение от Аноним (34), 05-Ноя-24, 13:29

когда тебе денег за работу не платят, то выбираешь сам когда и что делать по мере возможностей и желания.

Ответить | Правка | Наверх | Cообщить модератору

36. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +2 +/–

Сообщение от Аноним (31), 05-Ноя-24, 13:31

Справедливо Интел должна доплачивать чтобы кто-то юзал их лишние инструкции.

Ответить | Правка | Наверх | Cообщить модератору

41. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от Юрий (??), 05-Ноя-24, 13:49

Так интел уже официально не поддерживает AVX-512.

Ответить | Правка | Наверх | Cообщить модератору

49. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от Аноним (49), 05-Ноя-24, 14:43

А что так? Не взлетело?

Ответить | Правка | Наверх | Cообщить модератору

65. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +5 +/–

Сообщение от Аноним (65), 05-Ноя-24, 16:03

AVX-512 не реализовали в E-ядрах, поэтому интел инструкции отключил для всех потребительских процессоров (начиная с 2-й ревизии[1] 12 поколения). Разные наборы инструкций на разных ядрах то ли нельзя, то ли некрасиво.
Здесь в любом случае идеология есть: интел сильно топит за гетерогенность (большие P-ядра + малые E-ядра), а AVX-512 на кристаллах без E-ядер и возможность отключения E-ядер ради включения AVX-512 будут антирекламой гетерогенности.
Интел говорит, что когда-нибудь решит проблему, заменив AVX-512 на AVX10.2 (перед которым ещё когда-нибудь AVX10.1)...
[1] https://wccftech.com/heres-how-to-tell-between-an-avx-512-no.../

Ответить | Правка | Наверх | Cообщить модератору

113. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от Аноним (113), 06-Ноя-24, 03:24

Неужели не смогли с M$ договориться, чтобы помечать процессы, требующие avx512 и соответственно им автоматически проставлять аффинити на P ядра. Казалось бы, тривиальная вещь. Очень похоже на какой-то патент нарвались тут.

Ответить | Правка | Наверх | Cообщить модератору

117. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +3 +/–

Сообщение от Аноним (117), 06-Ноя-24, 10:44

Скорей похоже на залочку маркетингово.

Ответить | Правка | Наверх | Cообщить модератору

140. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (65), 06-Ноя-24, 22:12

Механизм может периодически ошибаться с вылетами приложений. Покупатели могут слишком много думать о пользе AVX-512 на больших ядрах (читай - о бесполезности малых ядер). Если покупателям не дать пистолет, они не выстрелят себе в ногу (и в репутацию Intel).
Хотя судя по wiki.osdev, может быть, даже возможно для ОС перенести процесс на P-ядро после исключения Invalid Opcode, то есть без пометок заранее: https://wiki.osdev.org/Exceptions#Invalid_Opcode

Ответить | Правка | К родителю #113 | Наверх | Cообщить модератору

95. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Фняк (?), 05-Ноя-24, 21:41

А про официально не поддерживает можно подробнее? Ну там ссылку на заявление Интел или что-то в этом духе

Ответить | Правка | К родителю #41 | Наверх | Cообщить модератору

109. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (65), 06-Ноя-24, 02:24

В серверных процессорах очевидно, что они есть и будут (и войдут в AVX10.1/512).
В десктопах их нет, что-то войдёт в AVX10.2/256[1] (где-то пишут, что в Nova Lake в 2026-2027). Я выше неточно написал, новые инструкции появятся, операции над 512 битами - нет (примерно как AVX-512VL?): "converged vector ISA [AVX10/256] ... supported on all future Intel processors ... supported on both P-cores and E-cores ... limited to a maximum 256-bit vector length".
Почему AMD полноценно смог в 2022, а Intel только начнёт снова плодить фрагментацию в 2026-2027? И ведь будущий более фрагментированный подход (AVX10/128, AVX10/256, AVX10/512) опирается на то, что не будут на асме вручную писать как в новости?
InstLatX64 в твиттере публикует страшные диаграммы Венна, показывающие, как поддерживаются разными семействами процессоров разные части AVX-512, AMX и x64 SIMD в целом.
[1] https://cdrdv2-public.intel.com/828965/361050-intel-avx10.2-... Figure 1-2

Ответить | Правка | Наверх | Cообщить модератору

80. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." –1 +/–

Сообщение от Соль земли (?), 05-Ноя-24, 17:55

в прошлом майкрософт доплачивала, чтобы винду везде ставили... и вот результат

Ответить | Правка | К родителю #36 | Наверх | Cообщить модератору

118. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от Аноним (117), 06-Ноя-24, 10:46

Думаю и Intel и прочие, просто у первой раз в 1000 денег больше даже чем у AMD, не говоря про других. Достаточно оглянуться на то сколько всего неадекватно-тормозного...

Ответить | Правка | Наверх | Cообщить модератору

39. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +6 +/–

Сообщение от Anony (?), 05-Ноя-24, 13:40

Ты думаешь что все пользователи и все сервера сразу же в 2016 году обновились на новые процессоры с поддержкой AVX-512? Серьезно?

Ответить | Правка | К родителю #31 | Наверх | Cообщить модератору

43. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от Аноним (43), 05-Ноя-24, 14:23

Массовыми такие процессоры стали далеко не в 2016.
А когда стали появляться, Intel отрубила в т.ч. из-за роста температуры :))

Ответить | Правка | Наверх | Cообщить модератору

56. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +8 +/–

Сообщение от Вертел ваши спинеры (?), 05-Ноя-24, 15:07

Под сокет АМ5 завезли.
А раз они есть, то надо их использовать. Зря чтоли апгрейдился.
Что там у интела не интересно и вообще пофик

Ответить | Правка | К родителю #39 | Наверх | Cообщить модератору

101. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от Аноним (31), 05-Ноя-24, 23:50

Не находишь орным что сабж реализовали после деприкейта avx512?

Ответить | Правка | К родителю #39 | Наверх | Cообщить модератору

134. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от Аноним (134), 06-Ноя-24, 19:28

То, что его депрекетнул идущий ко дну Интел - исключительно его проблемы. AMD пока AVX512 не депрекейтит. Интересно, еще существуют люди в здравом уме, кто покупает интел в 2024? Mindfactory отчитался, что среди их покупателей таких почти не осталось.
> Mindfactory не продала за неделю ни одного Arrow Lake — похоже, немцам не нужны новые чипы Intel

Ответить | Правка | Наверх | Cообщить модератору

139. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (65), 06-Ноя-24, 21:54

Arrow Lake от следующих слов лучше, конечно, не станет, но Mindfactory - это вообще-то партнёр AMD, ему положено рекламировать AMD (что он и делает) и выгодные предложения делать тоже, наверное (правильная статистика продаж - хорошая реклама).

Ответить | Правка | Наверх | Cообщить модератору

40. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +2 +/–

Сообщение от Аноним (40), 05-Ноя-24, 13:49

На 12400 попытались появиться, но интел быстренько резанули это дело. А проц 22-го года, если что.

Ответить | Правка | К родителю #31 | Наверх | Cообщить модератору

45. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +3 +/–

Сообщение от Ivan_83 (ok), 05-Ноя-24, 14:25

Не, чувак, тут вопросы к чипмейкерам.
Я очень хотел проц с AVX512 а интел только завтраками кормило и в итоге зажало это для серверных камней.
АМД только вот только для ам5 сокета раздуплилось.
Потом там разные наборы этого AVX512 доступны, типа здесь одно - там другое. Я когда на AVX кодил мне часто из AVX2 не хватало инструкций, а с AVX512 я так понял что наборы ещё скуднее.
А судя по тестам - мне и на обычном AVX2 производительности хватит :)
Да даже на коредуба с SSSE3 видимо есть жизнь :)

Ответить | Правка | К родителю #31 | Наверх | Cообщить модератору

102. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (31), 05-Ноя-24, 23:53

Даже спрашивать страшно где ты там на своей фряхе используешь avx. А я даже и спрашивать не буду.

Ответить | Правка | Наверх | Cообщить модератору

142. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (-), 07-Ноя-24, 10:18

Intel Core 2 Duo - это и SSE4.1.

Ответить | Правка | К родителю #45 | Наверх | Cообщить модератору

148. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (148), 07-Ноя-24, 13:41

Не все.

Ответить | Правка | Наверх | Cообщить модератору

69. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от laindono (ok), 05-Ноя-24, 16:43

8 лет в контексте x86 это буквально вчера. Жизненный цикл процессора может быть весьма долгим. Судя по стимовской статистике (первое, что пришло на ум), AVX512 это где-то 15-20%. Не очень много. Хотя предположу, что на серверах с этим несколько лучше.

Ответить | Правка | К родителю #31 | Наверх | Cообщить модератору

78. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Ivan_83 (ok), 05-Ноя-24, 17:25

У интела жизненный цикл проца 1-2 года, как и платформы.
За 10 лет интел сменил целую кучу процов и сокетов, а ам4 появился, вырос и появился ам5.

Ответить | Правка | Наверх | Cообщить модератору

83. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от laindono (ok), 05-Ноя-24, 18:03

Вопрос не в том, как часто обновы появляются, а как быстро старые уходят из употребления. Это же не смартфоны, где архитектура процев очень быстро обрастает добавками.

Ответить | Правка | Наверх | Cообщить модератору

85. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Ivan_83 (ok), 05-Ноя-24, 18:13

Смартфоны часто оборачиваются не из за процов а просто потому что экран или батарея или утопили.

Ответить | Правка | Наверх | Cообщить модератору

98. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (-), 05-Ноя-24, 23:02

> У интела жизненный цикл проца 1-2 года, как и платформы.
Случайно вышло, вот, полгода :) потом проц выгорает нахрен. Народ не оценил и акции интела покатились куда-то вниз, и периодически снизу стучат.
Ну правильно, хрен с ними с нормальными процами и честными нанометрами - зато, вот, management engine напихать ресурсы были :)

Ответить | Правка | К родителю #78 | Наверх | Cообщить модератору

89. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от mr. cake (?), 05-Ноя-24, 19:19

Инструкции-то были, но были только в интелах где от них включался тротлинг по частоте, т. е. смысла из использовать было ноль

Ответить | Правка | К родителю #31 | Наверх | Cообщить модератору

90. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от Кирилл (??), 05-Ноя-24, 19:58

Инструкции то появились... ну где то. А когда они появились на твоём столе?

Ответить | Правка | К родителю #31 | Наверх | Cообщить модератору

92. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." –1 +/–

Сообщение от Аноним (92), 05-Ноя-24, 20:46

AV1 был впервые опубликован 28 марта 2018, то есть 6,5 лет назад. Это все-таки меньше, чем 8.

Ответить | Правка | К родителю #31 | Наверх | Cообщить модератору

128. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от 1 (??), 06-Ноя-24, 18:04

Тебе никто не обязан этого делать. Ребята сделали, почёт им.

Ответить | Правка | К родителю #31 | Наверх | Cообщить модератору

3. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +11 +/–

Сообщение от dim4k (ok), 05-Ноя-24, 11:04

Ассемблер стреляет тогда - когда этого никто не ждёт😏😏😏

Ответить | Правка | Наверх | Cообщить модератору

16. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от КО (?), 05-Ноя-24, 12:09

Осталось только найти что конкретно сломали, лол

Ответить | Правка | Наверх | Cообщить модератору

19. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от Ник (??), 05-Ноя-24, 12:18

Нужно было писать на Java, там же волшебный jit который сам весь код оптимизирует!

Ответить | Правка | К родителю #3 | Наверх | Cообщить модератору

99. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от Аноним (-), 05-Ноя-24, 23:03

Он и оптимизирует волшебный жор проца и оперативы. Станет жрать RAM и CPU в разы лучше. А вы разве сомневались? :)

Ответить | Правка | Наверх | Cообщить модератору

4. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +2 +/–

Сообщение от Аноним (4), 05-Ноя-24, 11:06

Avx всё так же режет частоту процессора? Кто-нибудь уже составил сравнительную табличку того, чем придётся жертвовать при задействовании?

Ответить | Правка | Наверх | Cообщить модератору

7. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от dalco (ok), 05-Ноя-24, 11:13

Вроде как, урезание частот при включенном AVX относилось только к ранним моделям "синих".

Ответить | Правка | Наверх | Cообщить модератору

10. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +2 +/–

Сообщение от Аноним (4), 05-Ноя-24, 11:17

Они там повторяли с каждым новым avx.

Ответить | Правка | Наверх | Cообщить модератору

11. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +8 +/–

Сообщение от Cykooz (ok), 05-Ноя-24, 11:25

В моих реализациях для AVX2, с использованием fixed-point арифметики, какой либо выигрыш перед наивной реализацией на float-ах, без AVX-а, полностью исчезает при выполнении задачи уже в 7-8 параллельных потоках.
Так что если нужна именно однопоточная скорость, то SIMD дают заметный выигрыш. А в многопоточке, чем больше потоков, тем меньше выигрыш. Я полагаю, что это из-за снижения частоты ядер процессора при использовании SIMD.
PS: У меня AMD Ryzen 9 5950X, в нём нет AVX-512.

Ответить | Правка | К родителю #4 | Наверх | Cообщить модератору

21. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." –3 +/–

Сообщение от ryoken (ok), 05-Ноя-24, 12:31

>>наивной реализацией

Ответить | Правка | Наверх | Cообщить модератору

27. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +3 +/–

Сообщение от Аноним (27), 05-Ноя-24, 12:42

Может быть, он даже не ошибся. Называют же, например, реализацию преобразования Фурье в лоб, как по формуле, наивной.

Ответить | Правка | Наверх | Cообщить модератору

60. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." –1 +/–

Сообщение от Аноним (60), 05-Ноя-24, 15:35

> Может быть, он даже не ошибся.
ошибся, ибо то что он описал это тупо замена последовательных вычислений на параллельные, сам алгоритм не изменился. А в случае с "наивностью", сравните, к примеру, "наивный" алгоритм сортировки (перебор) с алгоритмом "быстрой" сортировки, это два разных алгоритма.

Ответить | Правка | Наверх | Cообщить модератору

64. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +2 +/–

Сообщение от Cykooz (ok), 05-Ноя-24, 15:54

Под "наивной" я имел ввиду без ассемблера и без вызова разных интринсиков. Исключительно на базовых возможностях языка программирования, наивно рассчитывая что компилятор сотворит волшебство и выдаст самый оптимальный код.
В реальности, по дефолту, если там и появляются на выходе какие-то SIMD, то максимум SSE2, который гарантируется архитектурой x86-64 и который компилятор может использовать.
Алгоритм у меня один и тот же - берём пиксель, умножаем на коэффициент, результат прибавляем к аккумулятору. Кроме как распараллеливания там ничего особенно волшебного не придумаешь. Разве что fixed-point использовать вместо float-ов.

Ответить | Правка | Наверх | Cообщить модератору

68. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (60), 05-Ноя-24, 16:24

> Под "наивной" я имел ввиду без ассемблера и без вызова разных интринсиков.
думаю, уместно было бы написать "нативной (простой) реализацией на float-ах"
> Кроме как распараллеливания там ничего особенно волшебного не придумаешь.
и оно со своими ограничениями (проблема ввода)

Ответить | Правка | Наверх | Cообщить модератору

154. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (154), 08-Ноя-24, 08:30

Можно ли объединить подходы с использованием fixed-point и расширений SSE2? Возможно, такой подход позволит достичь производительности, сопоставимой с AVX-512, и, вероятно будет более энергоэффективным. Не говоря уже о совместимости.

Ответить | Правка | К родителю #64 | Наверх | Cообщить модератору

157. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Cykooz (ok), 08-Ноя-24, 17:04

> Можно ли объединить подходы с использованием fixed-point и расширений SSE2? Возможно, такой
> подход позволит достичь производительности, сопоставимой с AVX-512, и, вероятно будет
> более энергоэффективным. Не говоря уже о совместимости.
Если он будет более энергоэффективным, то он не будет такой же производительный как AVX-512. Иначе бы это означало что AVX-512 требует мощности на 146%, а отрабатывает только на 100% и потому SSE2 может его "догнать" по скорости.
У меня есть реализация для SSE4.1. Она быстрее чем "нативная", но медленнее чем AVX-2. Полагаю с SSE2 будет не сильно быстрее "нативного" решения, т.к. сам компилятор может использовать SSE2 при оптимизации. А вот SSE4 он уже не может без специальной опции.
Но я не вижу смысла использовать SSE2, т.к. это прям очень старое железо, раз оно не умеет в SSE4.

Ответить | Правка | Наверх | Cообщить модератору

47. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от НяшМяш (ok), 05-Ноя-24, 14:31

Это из-за снижения частоты процессора с ростом потоков. У меня в однопотоке такой же процессор бустится почти до 5.2, а во многопотоке до 4.4-4.6. Но у меня хороший кулер на процессоре и я довольно много потратил времени в биосе настраивая лимиты, чтобы он так работал. В стоке эти цифры ещё меньше будут.

Ответить | Правка | К родителю #11 | Наверх | Cообщить модератору

53. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +2 +/–

Сообщение от Ivan_83 (ok), 05-Ноя-24, 14:49

У него АМД, вряд ли просадка с 4 до 3,4 даст заметное проседание скорости, а ниже базовой АМД не сбрасывает, только тротлить может при перегреве.
Я у себя вообще везде бусты выключил чтобы не тратить время и силы на охлаждение, а местами ещё и частота ниже базовой установлена.

Ответить | Правка | Наверх | Cообщить модератору

144. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (-), 07-Ноя-24, 11:35

Поправку надо сделать. Я не внимательно посмотрел, не один процессор 128 ядер, а два процессора по 64 ядра, в сумме 128 ядер и в сумме 256 потоков.

Ответить | Правка | К родителю #47 | Наверх | Cообщить модератору

145. Скрыто модератором +/–

Сообщение от Аноним (-), 07-Ноя-24, 11:35

https://habr.com/ru/news/784914/ Эх зря я покупал процессор от Intel с 128 (реальный процессор) ядрами - сарказм.

Ответить | Правка | К родителю #47 | Наверх | Cообщить модератору

48. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (48), 05-Ноя-24, 14:34

Лучше в 1 потоке в 8 раз быстрее считать, чем в 8 потоках с той же скоростью.

Ответить | Правка | К родителю #11 | Наверх | Cообщить модератору

66. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Cykooz (ok), 05-Ноя-24, 16:04

Не совсем так, мультипоток даёт прирост скорости даже при использовании SIMD. Просто относительное ускорение за счёт муторной ручной эквилибристики с SIMD инструкциями пропадает при каком-то числе потоков. Т.е. при необходимости можно выбирать что важнее: скорость в однопотоке, или простота написания и читаемость кода в реализации для мультипотока.

Ответить | Правка | Наверх | Cообщить модератору

50. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Ivan_83 (ok), 05-Ноя-24, 14:45

Таки ничего удивительного, учитывая что AVX позволяет более плотно загружать ИМЕЮЩИЕСЯ блоки, а у вас там гипертрединг ещё.

Ответить | Правка | К родителю #11 | Наверх | Cообщить модератору

146. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (-), 07-Ноя-24, 11:39

Поправку надо сделать. Я не внимательно посмотрел, не один процессор 128 ядер, а два процессора по 64 ядра, в сумме 128 ядер и в сумме 256 потоков. перепутал. Я на это отвеча: "задачи уже в 7-8 параллельных потоках"

Ответить | Правка | К родителю #11 | Наверх | Cообщить модератору

22. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (22), 05-Ноя-24, 12:33

На нормальных материнских платах можно регулировать оффсет частоты при выполнении AVX-инструкций, в т.ч. и ставить его в 0.

Ответить | Правка | К родителю #4 | Наверх | Cообщить модератору

73. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (73), 05-Ноя-24, 17:13

Сам по себе AVX на частоту не влияет никак. Частота снижается по средствам сторонних алгоритмов контроля потребления/температуры. Частота снижается не сильно 50-150Mhz, а некоторый код ускоряется очень сильно. https://www.techpowerup.com/review/amd-ryzen-9-9950x/

Ответить | Правка | К родителю #4 | Наверх | Cообщить модератору

152. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." –1 +/–

Сообщение от Аноним (152), 08-Ноя-24, 05:02

Я когда читал ваш тред, у меня рука от лица не отлипала.
Это надо же было не только придумать, но и реализовать такое издевательство над покупателем ваших процессоров, как нестабильная частота процессора при работе над разными задачами.

Ответить | Правка | К родителю #4 | Наверх | Cообщить модератору

156. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (134), 08-Ноя-24, 14:01

Так это придумали еще 20 лет назад, до появления троттлинга процессоры просто сгорали при превышении температуры. Зато да, частота была стабильная.

Ответить | Правка | Наверх | Cообщить модератору

8. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +5 +/–

Сообщение от _kp (ok), 05-Ноя-24, 11:14

Время перекодирования или только "некоторые операции"? ;)

Ps: и сравнение не с предудущим вариантом, а
"по сравнению с кодом на языке Си", то есть вообще без avx/sse.
Если б сравнили с i386, то прирост был бы еще больше.

Ответить | Правка | Наверх | Cообщить модератору

12. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Андрей (??), 05-Ноя-24, 11:32

Судя по скрину - некоторые операции... которые являются по сути базовыми для операций кодирования. Цельный результат оценить сложнее и скорее всего совокупный прирост небольшой, т.к. медленные операции того же чтения с диска быстрее не стали, да и в случае векторных расширений интересно на самом деле то, что там вообще кроме непосредственно одновременных вычислений есть куча расширений чисто для улучшения работы с кэшем, те же базовые load/store и вот тут предположу большую часть вклада внесли именно оптимизации работы кэша, а вычисления скорее довеском стали ибо будучи казалось бы более быстрыми они имеют высокие задержки и длятся дольше, ввиду чего задерживают конвеер не давая линейного прироста скорости.

Ответить | Правка | Наверх | Cообщить модератору

14. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (14), 05-Ноя-24, 11:54

> Время перекодирования или только "некоторые операции"? ;)
Отдельные функции.
> Если б сравнили с i386, то прирост был бы еще больше.
Сравнили с тем, что использовалось до этого.

Ответить | Правка | К родителю #8 | Наверх | Cообщить модератору

13. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." –1 +/–

Сообщение от Big Robert TheTables (?), 05-Ноя-24, 11:50

Вроде бы удаляли эти инструкции, но вообще интересно, для каких именно разработчиков эти наборы инструкций добавляли. Ибо авторы ффмпег сейчас совсем как мы, сторонние программисты - мы зашли в магазин автозапчастей и увидели, что на прилавке есть двигатель, который подойдет на замену нашему. Но ведь изначально-то движок был для какой-то другой ракеты, был разработан, сбалансирован, проверен для иного использования.
В идеале авторы кодеков должны делать брейншторм с авторами CPU. Если этого не делается, значит, с чипмейкерами брейнштормит кто-то другой.

Ответить | Правка | Наверх | Cообщить модератору

20. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." –1 +/–

Сообщение от Аноним (65), 05-Ноя-24, 12:22

> мы зашли в магазин автозапчастей и увидели, что на прилавке есть двигатель, который...
Нет, мы взяли котёнка по кличке "ядро", у которого есть дверцы разного размера (от 64 до 512) и попробовали самую большую. Получилось хорошо.
> Но ведь изначально-то движок был для какой-то другой ракеты
Нет, это универсальные дверцы для любых законных целей.
> должны делать брейншторм с авторами CPU
Тебе должны? Откуда уверенность, что им не хватает новой специальной дверцы?
> Вроде бы удаляли эти инструкции
Только в интелах с E-котятами, потому у этих малых котят нет 512-дверцы. Дверцы малым и большим котятам положено иметь одинаковые.

Ответить | Правка | Наверх | Cообщить модератору

33. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +2 +/–

Сообщение от Аноним (31), 05-Ноя-24, 13:28

Поэтому компания Интел и находится на грани банкротства с убытками 16 миллиардов в квартал. В квартал, Карл!

Ответить | Правка | Наверх | Cообщить модератору

42. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (65), 05-Ноя-24, 14:18

Не поэтому. С тем же успехом можно сказануть, что "у него хардварные кодеки лучше и энкодер AV1 в 15 поколении появился, за счёт них точно выкарабкается".

Ответить | Правка | Наверх | Cообщить модератору

59. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от _kp (ok), 05-Ноя-24, 15:29

> Поэтому
Из за этого покупатели не разбегаются.
А вот, скоропортящиеся лотерейные процесоры, это уже серьёзнее.

Ответить | Правка | К родителю #33 | Наверх | Cообщить модератору

86. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (14), 05-Ноя-24, 19:05

Проблемы у Intel начались задолго до фиаско с 13/14 поколением.

Ответить | Правка | Наверх | Cообщить модератору

62. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." –1 +/–

Сообщение от Аноним (60), 05-Ноя-24, 15:38

ссылку бы дать на квартальный финансовый отчет

Ответить | Правка | К родителю #33 | Наверх | Cообщить модератору

72. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Tita_M (ok), 05-Ноя-24, 17:02

На 3dnews.ru были новости, но там Интел писала, что это в основном разовые убытки из-за реструктуризации.

Ответить | Правка | Наверх | Cообщить модератору

108. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от Аноним (60), 06-Ноя-24, 01:22

интел писала на 3dnews.ru?

Ответить | Правка | Наверх | Cообщить модератору

110. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (60), 06-Ноя-24, 02:41

Вот если интересно, аноним выше непонимает разницы между расходом (ускоренной амортизацией) и убытком.
https://www.intc.com/financial-info
https://d1io3yog0oux5.cloudfront.net/_f78f77710807b13f2ecb12...
"""
and accelerated depreciation of $15.9 billion increased GAAP loss per share attributable to
Intel by $3.89.
"""

Ответить | Правка | К родителю #72 | Наверх | Cообщить модератору

120. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (31), 06-Ноя-24, 11:21

Ускоренная амортизация это такой же бред как отрицательный рост?  Забавно это слышать от юзера который сам не мог найти ссылку.

Ответить | Правка | Наверх | Cообщить модератору

122. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (60), 06-Ноя-24, 13:51

> это такой же бред
банкрот, убытки, звон и вечерний му**звон, доон
> который сам не мог найти ссылку
ссылку на подачу заявления о банкростве не нашел, так что ты у нас определен коментом ниже.

Ответить | Правка | Наверх | Cообщить модератору

158. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (134), 08-Ноя-24, 17:21

> ссылку на подачу заявления о банкростве не нашел
А зачем тебе ссылка? У анонима написано "на грани", не более. Ты придумал о подаче на банкротство, ты и представляй. Или ты споришь сам с собой?

Ответить | Правка | Наверх | Cообщить модератору

111. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (60), 06-Ноя-24, 03:15

помесячный график
https://ycharts.com/companies/INTC/net_income

Ответить | Правка | К родителю #72 | Наверх | Cообщить модератору

121. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (31), 06-Ноя-24, 11:21

Типа ты не верил в убытки или сам себе пытаешься доказать что у Интел все хорошо? ( у Интел все плохо ).

Ответить | Правка | Наверх | Cообщить модератору

123. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (60), 06-Ноя-24, 13:54

> Типа ты не верил
пену у рта протри, и балон с водой слей в канаву, а после пойми разницу между определением расходы и убыток.

Ответить | Правка | Наверх | Cообщить модератору

159. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (134), 08-Ноя-24, 17:26

Убыток — отрицательная разница между полученными доходами и произведенными расходами. Интел в пресс-релизе у себя написала, что в третьем квартале у нее убыток $16,64 млрд, или $3,88 на акцию. Ты готов поспорить с юристами/аудиторами самой Intel? Серьезно?

Ответить | Правка | Наверх | Cообщить модератору

82. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Бывалый Смузихлёб (ok), 05-Ноя-24, 18:02

Квартал ни о чём не говорит. Один может быть сильно более убыточный, другой - сильно более прибыльный. По году смотреть надо. Тем более, что финансовый год в сша кончается осенью

Ответить | Правка | К родителю #33 | Наверх | Cообщить модератору

100. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (4), 05-Ноя-24, 23:06

> Поэтому компания Интел и находится на грани банкротства с убытками 16 миллиардов
> в квартал. В квартал, Карл!
Копейки, тем более они в фабы вложились. Интел too big to fail, надо будет, включат принтер специально для него.

Ответить | Правка | К родителю #33 | Наверх | Cообщить модератору

104. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (31), 05-Ноя-24, 23:59

И получишь очередные Жигули.

Ответить | Правка | Наверх | Cообщить модератору

125. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." –1 +/–

Сообщение от Big Robert TheTables (?), 06-Ноя-24, 15:15

К сожалению, тут не котят в дверцы надо просунуть, но данные а) подготовить, б) выполнить инструкцию в) забрать. Если бы проблема была только в размерности, то данные оптимизации выполнялись бы сходу, при компиляции.
Смотрите, как на самом деле обстоит дело. Вам кажется,что разработчики ffmpeg играли в доту, смотрели ютуб, телегу читали, потом отвлеклись и быстро накатали код, что "в другую дверцу" подает трафик. Это упрощенное, свойственное вашему возрасту упрощение. по "тебе должны" тоже всё ясно с вами.
В реальности все немного сложнее.

Ответить | Правка | К родителю #20 | Наверх | Cообщить модератору

133. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (65), 06-Ноя-24, 19:24

> В реальности все немного сложнее.
Конечно сложнее, дверцы находятся внутри котят.

Ответить | Правка | Наверх | Cообщить модератору

141. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (65), 06-Ноя-24, 22:36

> тоже всё ясно с вами
"Когда в Интернете переходят на 'вы', в реальности давно бьют морду".
Меня тоже сильно удивила наивность - для AMD и Intel выгоднее продать новые CPU/GPU с аппаратными декодерами AV1, чем учесть потребности разработчиков dav1d. А при разработке очередного SIMD-расширения - смотреть, где деньги водятся (обычно не в свободных проектах).

Ответить | Правка | К родителю #125 | Наверх | Cообщить модератору

149. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Big Robert TheTables (?), 07-Ноя-24, 13:41

>> тоже всё ясно с вами
> "Когда в Интернете переходят на 'вы', в реальности давно бьют морду".
> Меня тоже сильно удивила наивность - для AMD и Intel выгоднее продать
> новые CPU/GPU с аппаратными декодерами AV1, чем учесть потребности разработчиков dav1d.
> А при разработке очередного SIMD-расширения - смотреть, где деньги водятся (обычно
> не в свободных проектах).
Согласен, не работал в Intel или Эльбрусе/Байкале, но это логично. Поговорить у доски с парой-другой алгоритмистов часок, попить чаю, подумать, таких встреч провести десяток - вот и готова пользовательская история, запрос на "оффлоад" вычисленийв цпу.  Сторонние компании, где деньги водятся, более, чем охотно отпустят своих зубров на такие консультации.

Ответить | Правка | Наверх | Cообщить модератору

17. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от Аноним (17), 05-Ноя-24, 12:10

Чует моё сердце, что тут 100 пудово есть какой-нить "нюанс", типа всё делаем в однопотоке или ещё чего-нить подобное.

Ответить | Правка | Наверх | Cообщить модератору

37. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Rodegast (ok), 05-Ноя-24, 13:31

Нюанс в том что не везде он теперь будет работать.

Ответить | Правка | Наверх | Cообщить модератору

26. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (26), 05-Ноя-24, 12:42

Я надеюсь они пользовались GNU assembler с синтаксисом AT&T.

Ответить | Правка | Наверх | Cообщить модератору

30. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +4 +/–

Сообщение от Аноним (27), 05-Ноя-24, 12:51

Надеюсь, с синтаксисом Intel.

Ответить | Правка | Наверх | Cообщить модератору

35. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (31), 05-Ноя-24, 13:30

Надеюсь на раст.

Ответить | Правка | Наверх | Cообщить модератору

44. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от Аноним (27), 05-Ноя-24, 14:23

На Rust надейся, а сам не плошай.

Ответить | Правка | Наверх | Cообщить модератору

52. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (52), 05-Ноя-24, 14:49

Не надейтесь. Там ассемблер. Но и не расстраивайтесь. Для раста много ниш открывается. По замене питона, бейсика и т.п.

Ответить | Правка | К родителю #35 | Наверх | Cообщить модератору

58. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (48), 05-Ноя-24, 15:21

По факту это питон всех заменяет и вырвался на первое место по частоте использования.

Ответить | Правка | Наверх | Cообщить модератору

61. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." –1 +/–

Сообщение от _kp (ok), 05-Ноя-24, 15:35

>> место по частоте использования.
Так, это не осилили просто что то серьёзнее.
Вот на дорогах каких машин больше BMW ,или Лады? А что лучше?
Вот, и тут то же самое, среднестатистическому
большинству многое не по силам, и искренне радуются тому что есть. Но как только поячится возможность взять что то лучше, и возьмут, и польют грязью старое.

Ответить | Правка | Наверх | Cообщить модератору

105. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +2 +/–

Сообщение от Аноним (31), 06-Ноя-24, 00:01

В Германии БМВ сильно больше. Сказать то чего хотел? Что в нормальных странах выбирают нормальные автомобили?

Ответить | Правка | Наверх | Cообщить модератору

119. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от _kp (ok), 06-Ноя-24, 11:20

"частота использования" может указывать и на г0вно. И не только про авто вне Германии, вне системного программирования тоже пользуются тем что осилили, а не тем что лучше.

Ответить | Правка | Наверх | Cообщить модератору

79. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (65), 05-Ноя-24, 17:31

Фух, интеловский синтаксис, NASM.
https://code.videolan.org/videolan/dav1d/-/blob/master/meson...
https://code.videolan.org/videolan/dav1d/-/blob/master/src/x...
Количество ассемблерного кода угнетающее, как это вообще пишут.

Ответить | Правка | К родителю #30 | Наверх | Cообщить модератору

87. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от Аноним (14), 05-Ноя-24, 19:08

> Фух, интеловский синтаксис, NASM.
А вам не всё равно?

Ответить | Правка | Наверх | Cообщить модератору

91. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (65), 05-Ноя-24, 20:31

Зачем бы я тогда искал? От факта использования интеловского синтаксиса есть некое удовлетворение. Не всё потеряно в этом мире.

Ответить | Правка | Наверх | Cообщить модератору

96. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от 1001й глаз (?), 05-Ноя-24, 22:18

Не всё равно.

Ответить | Правка | К родителю #87 | Наверх | Cообщить модератору

114. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (-), 06-Ноя-24, 06:41

Ага, каталог blob  у проекта, которое не относится к проекту ffmpeg.

Ответить | Правка | К родителю #79 | Наверх | Cообщить модератору

137. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (65), 06-Ноя-24, 21:27

Угу, умные комментарии на опеннете.
Это часть гитхлабовских URL, алло: [1]
О том, что речь идёт о dav1d, написано и в новости.
FFmpeg - новость из их твиттера. Что именно они сделали - только фотографию на конференции[2] или доклад или сравнение производительности или коммит в dav1d - это не ко мне.
[1] https://stackoverflow.com/questions/39400848/in-github-urls-...
[2] https://www.videolan.org/videolan/events/vdd24/

Ответить | Правка | Наверх | Cообщить модератору

29. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (29), 05-Ноя-24, 12:50

кхм. а скомпилировать из си с использование указанных инструкций?

Ответить | Правка | Наверх | Cообщить модератору

32. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от BeLord (ok), 05-Ноя-24, 13:26

А компилятор смогёт?-))

Ответить | Правка | Наверх | Cообщить модератору

97. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (97), 05-Ноя-24, 22:51

А в чём проблема?

Ответить | Правка | Наверх | Cообщить модератору

116. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от n00by (ok), 06-Ноя-24, 10:32

В неумении эксперта задать ключ -S транслятору?

Ответить | Правка | Наверх | Cообщить модератору

46. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от Ivan_83 (ok), 05-Ноя-24, 14:29

На AVX2 главное не сильно хуже получилось.

Ответить | Правка | Наверх | Cообщить модератору

75. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +2 +/–

Сообщение от 12yoexpert (ok), 05-Ноя-24, 17:18

по логике avx512 должен быть в 256 раз быстрее avx2, но intel и тут облажались

Ответить | Правка | Наверх | Cообщить модератору

77. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Ivan_83 (ok), 05-Ноя-24, 17:22

У интела с неймингом традиционно плохо :)

Ответить | Правка | Наверх | Cообщить модератору

88. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (14), 05-Ноя-24, 19:09

> в 256 раз быстрее
В 100500 же ж.

Ответить | Правка | К родителю #75 | Наверх | Cообщить модератору

51. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (52), 05-Ноя-24, 14:47

> 94, 44, 64 и 4.24 раза по сравнению базовой реализацией
Представил себе качество базовой реализации.

Ответить | Правка | Наверх | Cообщить модератору

55. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от Аноним (55), 05-Ноя-24, 15:05

Рассуждать о качестве тут вообще не к месту.
Правильнее называть это не базовой реализацией, а референсом. Этот код должен быть просто написан, чтобы исключить ошибки в нём. Референс этот используется для проверки правильности результата оптимизированных реализаций. Поэтому сравнение в скорости с референсом вообще некорректно. Даже на Си можно написать код быстрее, но код этот будет сложным, и его самого придётся чем-то проверять. Оптимизированный код с векторами (векторные интринсики) можно и на Си написать, но в ffmpeg предпочитают ассемблер.
Новость желтушная от названия до содержания.

Ответить | Правка | Наверх | Cообщить модератору

63. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от Ivan_83 (ok), 05-Ноя-24, 15:49

А что там представлять?
Там видимо какая то простая операция, типа сложить однин кусок памяти с другим представив что это массивы uint8_t.
И код на си будет простым циклом проходящим по каждому элементу и делающему сложение.
Вот его переписали на SSSE и он стал за "одну операцию" складывать не 1 элемент а сразу 16, потом на AVX и там 32 а на AVX512 сразу 64 за раз.
Вот и вся магия, минус накладные расходы, а иногда плюс. Там есть всякие трюки с загрузкой в кеш и регистр и выгрузкой обратно в память, поэтому иногда на этом получается ещё немного выиграть скорости.
Технически некоторые вещи и на С доступны, типа префетч подёргать чтобы пока один элемент обрабатывается проц уже следуюшие подтягивал в кеш из памяти.
Просто обычно на С таким не занимаются, и сразу уходят в SIMD.

Ответить | Правка | К родителю #51 | Наверх | Cообщить модератору

67. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (55), 05-Ноя-24, 16:06

> Просто обычно на С таким не занимаются, и сразу уходят в SIMD.
Я не понимаю что на Opennet делают настолько необразованные люди. Которые не знают ни одной вещи о которой пишут. На Си можно писать код использующий векторные инструкции напрямую, и это не ассемблерные вставки, это называется векторные интринсики.

Ответить | Правка | Наверх | Cообщить модератору

70. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (60), 05-Ноя-24, 16:57

Intrinsics are just C-style functions that do something with these vector data types, usually by simply calling the associated assembly instruction.

Ответить | Правка | Наверх | Cообщить модератору

76. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +1 +/–

Сообщение от Ivan_83 (ok), 05-Ноя-24, 17:20

Вы бы читать научились.
ОБЫЧНО на С не используют такие штуки, в том числе и инстрикты и префетчи и пр.
И обычно не пишут код под векторизацию - я про разворачивание циклов в ручную, например когда один шаг цикла делают в 4-8-16 и за раз столько складывают.
Про инстрикты в С я лично знаю лет 10 как минимум и у меня есть пачка кода на этом.
И префетчем я баловался в С в коде без инстриктов и это даже давало какой то еле заметный эффект.

Ответить | Правка | К родителю #67 | Наверх | Cообщить модератору

126. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (55), 06-Ноя-24, 16:22

> ОБЫЧНО на С не используют такие штуки
Что значит обычно? Это как-то связано с тем что 99% случаев никто код не оптимизирует, это и делает вашу статистику? По моим наблюдениям в большинстве проектов, если занимаются оптимизациями, то пишут на Си с интринсиками, а не на ассемблере. Известный всем пример - OpenCV. Существуют мультиархитектурные обёртки вроде simde, чтобы под каждую архитектуру не писать отдельно. ffmpeg это как раз исключение, также в Intel любят писать на ассемблере (но с Intel это понятно). И даже в ffmpeg есть несколько архитектур где оптимизировано через интринсики на Си.

Ответить | Правка | Наверх | Cообщить модератору

127. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (60), 06-Ноя-24, 17:48

> то пишут на Си с интринсиками, а не на ассемблере.
а разве есть разница?

Ответить | Правка | Наверх | Cообщить модератору

130. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (55), 06-Ноя-24, 18:14

Разница в чём? В производительности будет одно и то же. Если вы не мега-эксперт по ассемблеру, вроде сотрудника Intel, что знает все тайминги и особенности современных x86 процессоров. Если же  плохо знать ассемблер, то компилятор векторные команды может расположить более оптимально.
Си с интринсиками читать, писать, изменять и отлаживать быстрее и проще ассемблерного кода. К тому же ассемблерный код придётся писать для 32 и 64 версий архитектуры. Или городить горы костылей с макросами, чтобы один ассемблерный код компилировался для x86 и x86_64. А у ARM вообще ассемблер заметно отличается для 32 и 64-бит версий архитектуры, особенно для векторных команд. При этом при использовании векторных интринсиков на Си разница кода между 32 и 64-бит минимальная. Вот и думайте что лучше.
И еще в libjpeg-turbo используется ассемблер для x86. Между тем ARM на интринсиках, и несколько других архитектур оптимизированы на интринсиках.

Ответить | Правка | Наверх | Cообщить модератору

131. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (60), 06-Ноя-24, 18:31

> К тому же ассемблерный код придётся писать для 32 и 64 версий архитектуры.
то есть я пишу на С и пихаю асм вставки векторных инструкций и мне надо будет задуматься о разрядности архитектуры? А в случае использования явных интринсиктов - думать не надо?
https://en.wikipedia.org/wiki/Intrinsic_function
> При этом при использовании векторных интринсиков на Си разница кода между 32 и 64-бит минимальная.
Так разница есть или нет?

Ответить | Правка | Наверх | Cообщить модератору

135. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (55), 06-Ноя-24, 19:48

> то есть я пишу на С и пихаю асм вставки векторных инструкций
Где в процитированный для виду википедии написано что интринсики это асм вставки? Загляни в хидеры, докажи что интринсики это лишь асм вставки. Потому что это не асм вставки, а builtin функции, что реализованы вне зависимости от адресации. В википедии прям в начале написано "also called built-in function or builtin function". Цитировать умеем, а читать? За редким исключением, когда команда реально зависит от режима, тогда в Си делают #if #else вставку, этого немного.

Ответить | Правка | Наверх | Cообщить модератору

138. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (60), 06-Ноя-24, 21:27

> Где в процитированный для виду википедии написано что интринсики это асм вставки?
вам теперь скинуть ссылку на определение "built-in function"?

Ответить | Правка | Наверх | Cообщить модератору

136. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Ivan_83 (ok), 06-Ноя-24, 20:43

Чтобы оптимизировать код не обязательно опускатся на низкий уровень и писать инстриктами/SIMD код, это обычно самое последнее что делают.
Высокороуровневые оптимизации часто могут дать выигрыш намного больше чем SIMD.
Когда я возился с ECDSA то оказалось что там есть много интересных методов рассчёта дающих тот же самый математический результат за в разы меньшее время.
Я веду к тому что написать memcpy() быстрее чем тот монстр что там сейчас включающий в себя SIMD реализацию не получится, но бывают случаи когда можно этот самый memcpy() дергать намного реже.
Я тут в качестве хобби возился с реализацией гост хэша на SEE/AVX.
После длительной возни я пришёл к выводу что проще на обычном С коде работать с тамошним uint512_t счётчиком битов чем мучатся с длинной арифметикой на SIMD. По скорости С вариант даже быстрее местами чем SIMD, и это позмолилось понизить требования до AVX1 и SSE который есть в коредуба.
И в целом проектов где всё упирается в числодробилку, наподобии OpenCV, ffmpeg (кодеков) не так много.
Я часто возился с тормозящим кодом где была проблема в неоптимальном высокоуровневом коде, последние разы это были gtk3 и CodeLite.
В последнем проблемы с крестовой лапшой, когда с виду невинные конструкции порождают чудовищный код.

Ответить | Правка | К родителю #126 | Наверх | Cообщить модератору

54. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +4 +/–

Сообщение от Аноним (55), 05-Ноя-24, 14:55

> в 94 раза ускорить
Ужасно желтушный заголовок, потому что сравнивать надо не с Си, а с оптимизацией на предыдущих векторных инструкциях, то есть AVX2.
А там быстрее примерно в 1.5 раза, и это при увеличении длины векторов в 2 раза. И еще неизвестно как это влияет на процессор.

Ответить | Правка | Наверх | Cообщить модератору

81. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Соль земли (?), 05-Ноя-24, 18:01

Скорее всего сравнивают то, что успели накодить для теста. Так то можно и Си заставить использовать любые инструкции.

Ответить | Правка | Наверх | Cообщить модератору

84. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (65), 05-Ноя-24, 18:12

Не, всё написано, последнее изменение полгода назад, почти сплошной асм отдельными файлами.
https://code.videolan.org/videolan/dav1d/-/blob/master/src/x...

Ответить | Правка | Наверх | Cообщить модератору

71. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (71), 05-Ноя-24, 16:59

Базовые реализации у всех тестов кроме первого совсем медленные, может, вместо ускорения остальных реализаций были замедлены базовые, чтобы желтушники сообщили об огромном ускорении?

Ответить | Правка | Наверх | Cообщить модератору

129. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (129), 06-Ноя-24, 18:10

Очень похоже на то: https://news.ycombinator.com/item?id=42042706
Но не совсем, ускорение всё же есть, просто чтобы получить заявленные 146% пришлось затормозить сишный код.

Ответить | Правка | Наверх | Cообщить модератору

93. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (92), 05-Ноя-24, 20:51

Еще бы найти где-то видео в формате AV1.

Ответить | Правка | Наверх | Cообщить модератору

94. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +2 +/–

Сообщение от Аноним (94), 05-Ноя-24, 21:35

Уже давно YouTube и русские сервера с видео поставляют его. Смотрите техническую информацию в видео при воспроизведении

Ответить | Правка | Наверх | Cообщить модератору

106. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." –1 +/–

Сообщение от Аноним (31), 06-Ноя-24, 00:02

Не надо так.

Ответить | Правка | Наверх | Cообщить модератору

115. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Ilya Indigo (ok), 06-Ноя-24, 07:22

Мне больше интересно насколько с AVX512 производительнее чем с AVX256 и стоит ли оно того?

Ответить | Правка | Наверх | Cообщить модератору

124. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от anon111 (?), 06-Ноя-24, 14:16

См. тему про тестирование cpu в ffmpeg на форуме ixbt. Если коротко, бывает даёт +5-10% скорости кодирования. Это было до новой версии ffmpeg. Посмотрим, что изменится с новинкой.

Ответить | Правка | Наверх | Cообщить модератору

132. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Bottle (?), 06-Ноя-24, 19:18

А потом говорят, что Сишка быстрая.

Ответить | Правка | Наверх | Cообщить модератору

147. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (147), 07-Ноя-24, 12:57

Сишка не исполняется

Ответить | Правка | Наверх | Cообщить модератору

153. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (152), 08-Ноя-24, 05:08

Работают ли эти оптимизации на aarch64?

Ответить | Правка | Наверх | Cообщить модератору

155. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..." +/–

Сообщение от Аноним (155), 08-Ноя-24, 13:05

Нет кончено, это не для армов.

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема

Партнёры:

Хостинг:

Закладки на сайте
Проследить за страницей

Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру

1. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+48 +/–
Сообщение от Мохнонос (?), 05-Ноя-24, 11:03
Молодцы! Вот есть же разработчики, которые кроме обвеса плюшками и раскабанивания ПО ведут его непосредственную тщательную полировку
Ответить \| Правка \| Наверх \| Cообщить модератору


	31. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	–22 +/–
	Сообщение от Аноним (31), 05-Ноя-24, 13:24
	AVX512 инструкции появились в 2016 году 8 лет назад внимание вопрос. Это так долго до разработчиков доходила весть что инструкции появились? Они так долго копили на проц с поддержкой данных инструкций? Они 8 лет разрабатывали алгоритм? Ответ на любой вопрос показывает что разрабы у ффмпег не очень скажем так.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	34. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+24 +/–
	Сообщение от Аноним (34), 05-Ноя-24, 13:29
	когда тебе денег за работу не платят, то выбираешь сам когда и что делать по мере возможностей и желания.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	36. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+2 +/–
	Сообщение от Аноним (31), 05-Ноя-24, 13:31
	Справедливо Интел должна доплачивать чтобы кто-то юзал их лишние инструкции.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	41. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+1 +/–
	Сообщение от Юрий (??), 05-Ноя-24, 13:49
	Так интел уже официально не поддерживает AVX-512.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	49. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+1 +/–
	Сообщение от Аноним (49), 05-Ноя-24, 14:43
	А что так? Не взлетело?
	Ответить \| Правка \| Наверх \| Cообщить модератору


	65. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+5 +/–
	Сообщение от Аноним (65), 05-Ноя-24, 16:03
	AVX-512 не реализовали в E-ядрах, поэтому интел инструкции отключил для всех потребительских процессоров (начиная с 2-й ревизии[1] 12 поколения). Разные наборы инструкций на разных ядрах то ли нельзя, то ли некрасиво. Здесь в любом случае идеология есть: интел сильно топит за гетерогенность (большие P-ядра + малые E-ядра), а AVX-512 на кристаллах без E-ядер и возможность отключения E-ядер ради включения AVX-512 будут антирекламой гетерогенности. Интел говорит, что когда-нибудь решит проблему, заменив AVX-512 на AVX10.2 (перед которым ещё когда-нибудь AVX10.1)... [1] https://wccftech.com/heres-how-to-tell-between-an-avx-512-no.../
	Ответить \| Правка \| Наверх \| Cообщить модератору


	113. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+1 +/–
	Сообщение от Аноним (113), 06-Ноя-24, 03:24
	Неужели не смогли с M$ договориться, чтобы помечать процессы, требующие avx512 и соответственно им автоматически проставлять аффинити на P ядра. Казалось бы, тривиальная вещь. Очень похоже на какой-то патент нарвались тут.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	117. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+3 +/–
	Сообщение от Аноним (117), 06-Ноя-24, 10:44
	Скорей похоже на залочку маркетингово.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	140. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+/–
	Сообщение от Аноним (65), 06-Ноя-24, 22:12
	Механизм может периодически ошибаться с вылетами приложений. Покупатели могут слишком много думать о пользе AVX-512 на больших ядрах (читай - о бесполезности малых ядер). Если покупателям не дать пистолет, они не выстрелят себе в ногу (и в репутацию Intel). Хотя судя по wiki.osdev, может быть, даже возможно для ОС перенести процесс на P-ядро после исключения Invalid Opcode, то есть без пометок заранее: https://wiki.osdev.org/Exceptions#Invalid_Opcode
	Ответить \| Правка \| К родителю #113 \| Наверх \| Cообщить модератору


	95. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+/–
	Сообщение от Фняк (?), 05-Ноя-24, 21:41
	А про официально не поддерживает можно подробнее? Ну там ссылку на заявление Интел или что-то в этом духе
	Ответить \| Правка \| К родителю #41 \| Наверх \| Cообщить модератору


	109. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+/–
	Сообщение от Аноним (65), 06-Ноя-24, 02:24
	В серверных процессорах очевидно, что они есть и будут (и войдут в AVX10.1/512). В десктопах их нет, что-то войдёт в AVX10.2/256[1] (где-то пишут, что в Nova Lake в 2026-2027). Я выше неточно написал, новые инструкции появятся, операции над 512 битами - нет (примерно как AVX-512VL?): "converged vector ISA [AVX10/256] ... supported on all future Intel processors ... supported on both P-cores and E-cores ... limited to a maximum 256-bit vector length". Почему AMD полноценно смог в 2022, а Intel только начнёт снова плодить фрагментацию в 2026-2027? И ведь будущий более фрагментированный подход (AVX10/128, AVX10/256, AVX10/512) опирается на то, что не будут на асме вручную писать как в новости? InstLatX64 в твиттере публикует страшные диаграммы Венна, показывающие, как поддерживаются разными семействами процессоров разные части AVX-512, AMX и x64 SIMD в целом. [1] https://cdrdv2-public.intel.com/828965/361050-intel-avx10.2-... Figure 1-2
	Ответить \| Правка \| Наверх \| Cообщить модератору


	80. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	–1 +/–
	Сообщение от Соль земли (?), 05-Ноя-24, 17:55
	в прошлом майкрософт доплачивала, чтобы винду везде ставили... и вот результат
	Ответить \| Правка \| К родителю #36 \| Наверх \| Cообщить модератору


	118. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+1 +/–
	Сообщение от Аноним (117), 06-Ноя-24, 10:46
	Думаю и Intel и прочие, просто у первой раз в 1000 денег больше даже чем у AMD, не говоря про других. Достаточно оглянуться на то сколько всего неадекватно-тормозного...
	Ответить \| Правка \| Наверх \| Cообщить модератору


	39. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+6 +/–
	Сообщение от Anony (?), 05-Ноя-24, 13:40
	Ты думаешь что все пользователи и все сервера сразу же в 2016 году обновились на новые процессоры с поддержкой AVX-512? Серьезно?
	Ответить \| Правка \| К родителю #31 \| Наверх \| Cообщить модератору


	43. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+1 +/–
	Сообщение от Аноним (43), 05-Ноя-24, 14:23
	Массовыми такие процессоры стали далеко не в 2016. А когда стали появляться, Intel отрубила в т.ч. из-за роста температуры :))
	Ответить \| Правка \| Наверх \| Cообщить модератору


	56. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+8 +/–
	Сообщение от Вертел ваши спинеры (?), 05-Ноя-24, 15:07
	Под сокет АМ5 завезли. А раз они есть, то надо их использовать. Зря чтоли апгрейдился. Что там у интела не интересно и вообще пофик
	Ответить \| Правка \| К родителю #39 \| Наверх \| Cообщить модератору


	101. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+1 +/–
	Сообщение от Аноним (31), 05-Ноя-24, 23:50
	Не находишь орным что сабж реализовали после деприкейта avx512?
	Ответить \| Правка \| К родителю #39 \| Наверх \| Cообщить модератору


	134. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+1 +/–
	Сообщение от Аноним (134), 06-Ноя-24, 19:28
	То, что его депрекетнул идущий ко дну Интел - исключительно его проблемы. AMD пока AVX512 не депрекейтит. Интересно, еще существуют люди в здравом уме, кто покупает интел в 2024? Mindfactory отчитался, что среди их покупателей таких почти не осталось. > Mindfactory не продала за неделю ни одного Arrow Lake — похоже, немцам не нужны новые чипы Intel
	Ответить \| Правка \| Наверх \| Cообщить модератору


	139. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+/–
	Сообщение от Аноним (65), 06-Ноя-24, 21:54
	Arrow Lake от следующих слов лучше, конечно, не станет, но Mindfactory - это вообще-то партнёр AMD, ему положено рекламировать AMD (что он и делает) и выгодные предложения делать тоже, наверное (правильная статистика продаж - хорошая реклама).
	Ответить \| Правка \| Наверх \| Cообщить модератору


	40. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+2 +/–
	Сообщение от Аноним (40), 05-Ноя-24, 13:49
	На 12400 попытались появиться, но интел быстренько резанули это дело. А проц 22-го года, если что.
	Ответить \| Правка \| К родителю #31 \| Наверх \| Cообщить модератору


	45. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+3 +/–
	Сообщение от Ivan_83 (ok), 05-Ноя-24, 14:25
	Не, чувак, тут вопросы к чипмейкерам. Я очень хотел проц с AVX512 а интел только завтраками кормило и в итоге зажало это для серверных камней. АМД только вот только для ам5 сокета раздуплилось. Потом там разные наборы этого AVX512 доступны, типа здесь одно - там другое. Я когда на AVX кодил мне часто из AVX2 не хватало инструкций, а с AVX512 я так понял что наборы ещё скуднее. А судя по тестам - мне и на обычном AVX2 производительности хватит :) Да даже на коредуба с SSSE3 видимо есть жизнь :)
	Ответить \| Правка \| К родителю #31 \| Наверх \| Cообщить модератору


	102. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+/–
	Сообщение от Аноним (31), 05-Ноя-24, 23:53
	Даже спрашивать страшно где ты там на своей фряхе используешь avx. А я даже и спрашивать не буду.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	142. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+/–
	Сообщение от Аноним (-), 07-Ноя-24, 10:18
	Intel Core 2 Duo - это и SSE4.1.
	Ответить \| Правка \| К родителю #45 \| Наверх \| Cообщить модератору


	148. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+/–
	Сообщение от Аноним (148), 07-Ноя-24, 13:41
	Не все.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	69. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+1 +/–
	Сообщение от laindono (ok), 05-Ноя-24, 16:43
	8 лет в контексте x86 это буквально вчера. Жизненный цикл процессора может быть весьма долгим. Судя по стимовской статистике (первое, что пришло на ум), AVX512 это где-то 15-20%. Не очень много. Хотя предположу, что на серверах с этим несколько лучше.
	Ответить \| Правка \| К родителю #31 \| Наверх \| Cообщить модератору


	78. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+/–
	Сообщение от Ivan_83 (ok), 05-Ноя-24, 17:25
	У интела жизненный цикл проца 1-2 года, как и платформы. За 10 лет интел сменил целую кучу процов и сокетов, а ам4 появился, вырос и появился ам5.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	83. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+1 +/–
	Сообщение от laindono (ok), 05-Ноя-24, 18:03
	Вопрос не в том, как часто обновы появляются, а как быстро старые уходят из употребления. Это же не смартфоны, где архитектура процев очень быстро обрастает добавками.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	85. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+/–
	Сообщение от Ivan_83 (ok), 05-Ноя-24, 18:13
	Смартфоны часто оборачиваются не из за процов а просто потому что экран или батарея или утопили.
	Ответить \| Правка \| Наверх \| Cообщить модератору


	98. "Использование в FFmpeg инструкций AVX-512 позволило в 94 раз..."	+/–
	Сообщение от Аноним (-), 05-Ноя-24, 23:02
	> У интела жизненный цикл проца 1-2 года, как и платформы. Случайно вышло, вот, полгода :) потом проц выгорает нахрен. Народ не оценил и акции интела покатились куда-то вниз, и периодически снизу стучат. Ну правильно, хрен с ними с нормальными процами и честными нанометрами - зато, вот, management engine напихать ресурсы были :)
	Ответить \| Правка \| К родителю #78 \| Наверх \| Cообщить модератору