Опубликован релиз проекта PoCL 5.0 (Portable Computing Language OpenCL), развивающего реализацию стандарта OpenCL, независимую от производителей графических ускорителей и позволяющую использовать различные бэкенды для выполнения OpenCL-ядер на разных типах графических и центральных процессоров. Код проекта распространяется под лицензией MIT. Поддерживается работа на платформах X86_64, MIPS32, ARM v7, AMD HSA APU, NVIDIA GPU и различных специализированных ASIP (Application-Specific Instruction-set Processor) и TTA-процессорах (Transport Triggered Architecture) c архитектурой VLIW.
Реализация компилятора ядер OpenCL построена на базе LLVM, а в качестве фронтэнда для OpenCL C используется Clang. Для обеспечения должной переносимости и производительности компилятор ядер OpenCL может генерировать комбинированные функции, которые могут использовать различные аппаратные ресурсы для распараллеливания выполнения кода, такие как VLIW, суперскалярность, SIMD, SIMT, многоядерность и многопоточность. Имеется поддержка ICD-драйверов
(Installable Client Driver). Присутствуют бэкенды для обеспечения работы через CPU, ASIP (TCE/TTA), GPU на базе архитектуры HSA и GPU NVIDIA (через libcuda).
В новой версии:
- Реализован новый бэкенд "Remote", предназначенный для организации распределённых вычислений через вынос обработки команд OpenCL на другие хосты в сети, на которых запущен фоновый процесс pocld.
- В драйвере CUDA реализованы дополнительные возможности и расширения OpenCL 3.0, такие как атомарные операции, переменные с ограниченной областью видимости, подгруппы intel_sub_group_shuffle, intel_sub_group_shuffle_xor, get_sub_group_local_id, sub_group_barrier и sub_group_ballot.
- Улучшена поддержка CPU на базе архитектуры RISC-V. Работа PoCL протестирована на плате Starfive VisionFive 2 с загруженным окружением Ubuntu 23.10 с LLVM 17 и GCC 13.2.
- Реализовано расширение cl_ext_float_atomics с поддержкой FP32 и FP64.
- Реализация расширения cl_khr_command_buffer обновлена до версии 0.9.4.
- Предложен экспериментальный бэкенд AlmaIF для FPGA.
- Удалена незавершённая поддержка промежуточного представления шейдеров SPIR 1.x/2.0. В качестве рекомендованного промежуточного языка шейдеров заявлен SPIR-V.
- Добавлена поддержка Clang/LLVM 17.0. Объявлена устаревшей поддержка Clang/LLVM 10-13.
|