Анджей Яник (Andrzej Janik) представил обновление проекта ZLUDA, развивающего открытую реализацию технологии CUDA. Целью проекта является предоставление возможности запуска немодифицированных приложений CUDA на системах с GPU, отличных от GPU NVIDIA, с производительностью, близкой к производительности приложений, выполняемых без прослоек. Код проекта распространяется под лицензиями MIT и Apache 2.0.
ZLUDA 4 преподносится как первый выпуск, сформированный после чистки кодовой базы от кода, разработанного во время работы Анджея в компании AMD. С 2022 года Анджей работал в AMD над созданием слоя для совместимости GPU AMD с CUDA, но в 2024 году проект был свернут. В соответствии с условиями контракта и после получения разрешения на публикацию от представителя AMD, Анджей открыл код наработок, созданных во время работы в AMD и позволяющих выполнять CUDA-приложения поверх стека ROCm и runtime HIP (Heterogeneous-computing Interface for Portability). В октябре Анджей был вынужден убрать код из открытого доступа после письма от юристов, давших понять, что разрешение в ходе переписки по email не имеет юридической силы.
Новая редакция ZLUDA сформирована на основе кодовой базы, существовавшей до начала работы Анджея в AMD, не привязана к конкретным GPU и сосредоточена на выполнении приложений, использующих CUDA для ускорения задач, связанных с машинным обучением и искусственным интеллектом. Проект пока ограничивается работой на GPU AMD, но в дальнейшем будет адаптирован для GPU Intel. Выпуск ZLUDA 4 написан на языке Rust и ориентирован на выполнение тестового набора Geekbench 5.
Новая версия включает новый парсер для PTX, промежуточного языка, используемого в GPU NVIDIA. Выпуск также примечателен уходом от эмуляции специфичных для GPU NVIDIA инструкций инкремента и декремента по модулю, вместо которых теперь вызываются аналогичные инструкции GPU AMD. Указанные изменения позволили добиться повышения производительности при прохождении теста Geekbench примерно на 10%, по сравнению с OpenCL и веткой ZLUDA 3.
Хештеги:
#ZLUDA #CUDA #OpenSource #AndrzejJanik #GPU #MachineLearning #ArtificialIntelligence #RustLanguage #AMD #ROCm #HIP #OpenCL #Geekbench #TechUpdate #SoftwareDevelopment #CrossPlatform
Библиография:
**Яник, Анджей.** (2024). Обновление проекта ZLUDA. [Интернет-ресурс].
**CUDA и ROCm.** Heterogeneous-computing Interface for Portability: технологии и использование. Apache Software Foundation.
**Geekbench 5.** Кроссплатформенный тест производительности.
**Rust Language.** Программирование на Rust: особенности и преимущества.
**AMD GPU.** ROCm и его возможности. Технический обзор.
Если нужна дополнительная доработка, уточните, пожалуйста!
Проект поддерживает Windows и Linux, MacOS не поддерживается
https://github.com/vosen/ZLUDA/
OK, weil ich gestern gesehen hab, dass die neue 4. Staffel #HIP - Ermittlerin mit Mords-IQ mit Audrey #Fleurot nur noch bis 26.1. [!] online ist, empfehle ich die Serie in dieser Reihe doch noch ein wirklich letztes Mal.
Sehr, sehr skurril, sehr schnell und unkonventionell - und SEHR bunt. <3 Link zur 1. Folge der 1. Staffel siehe unten.
https://www.ardmediathek.de/serie/hip-ermittlerin-mit-mords-iq/staffel-1/Y3JpZDovL25kci5kZS80NzQ0/1
HIP - We need a revolution and we're playing tough music - the movie stops tomorrow ...
We’re excited to announce the release of AMD HIPRT v2.4, featuring H-PLOC, a GPU-optimized algorithm for building BVHs:
https://gpuopen.com/hiprt/?utm_source=mastodon&utm_medium=social&utm_campaign=hiprt
Read our H-PLOC paper here: https://gpuopen.com/download/publications/HPLOC.pdf?utm_source=mastodon&utm_medium=social&utm_campaign=hiprt #raytracing #HIP #GPU
We've got a #raytracing double feature for you today in our latest blog
Firstly, the brand-new v2.2 version of #HIP RT brings support for multi-level instancing, which can help reduce memory requirements of your scenes.
Secondly, we're announcing the release of a #HIP port for #PBRT-v4.
The code is now available on #github along with detailed instructions for getting started.
Find it over on GitHub here: https://github.com/GPUOpen-Effects/pbrt-v4
And we have more…
Radeon GPU Analyzer (RGA) v2.9 is available - with a new Binary Analysis mode
This mode allows you to visualize the #VGPR pressure of kernels in pre-compiled #HIP binaries.
Check out RGA on #GPUOpen!
(4/6)
https://gpuopen.com/rga/?utm_source=mastodon&utm_medium=social&utm_campaign=rga
#HIP RT is a great library for writing #raytracing apps but it can also be used in other fields.
Our latest post demonstrates how to use HIP RT to accelerate fluid simulations
HIP RT makes it easy to implement SPH simulations on GPUs.
Want to know more about the latest version of #HIP #Raytracing (HIP RT) library - v2.1?
Our new blog takes you through updates which include batch construction, global/dynamic stacks, #transformation query functions, and more.
Head over to #GPUOpen to find out more: https://gpuopen.com/learn/hiprt_2_1_batch_construction_transformation_functions/?utm_source=mastodon&utm_medium=social&utm_campaign=hiprt
We've got a new version of #HIP #Raytracing available on GPUOpen!
Featuring:
Batch BVH construction
Dynamic traversal stack assignment
Transformation query functions
.. and more.
Download HIP RT now from #GPUOpen: https://gpuopen.com/hiprt/?utm_source=mastodonr&utm_medium=social&utm_campaign=hiprt
Join us for our #HiP Party at 21h at #Milliways Village!
#cccamp23
And if you helped us as an Angel, you can pick up your T-shirt there as well.
#HiP
Remember december?
It was cold and we could only meet in "small" groups.
Now we are back at #cccamp23 and want to meet up with all creatures from "Hacking in Parallel" for a party. Join us on Day 3 from 21h at #Milliways.
#HiP
#HiP-Berlin