随着本周推出rocm 5.0,amd 工程师在周五发布了 radeon aomp 14.0-2,作为 llvm/clang 的下游,专注于将 openmp 卸载到 radeon gpu 的最新补丁。
aomp 14.0-2 是他们在下游的 llvm/clang 的最新版本,它携带 amd 最新的 gpu 卸载补丁,直到它们准备好用于主线/上游集成。早在 11 月,他们就在开始跟踪 llvm/clang 14.0 git 开发时推出了 aomp 14.0,并在 1 月更新了新的 aomp 快照,并于昨天发布了 aomp 14.0-2。他们的 llvm/clang 快照是本月早些时候在 llvm 14.0 分支之前的上游快照,其中最新的 git 代码上游现在在 llvm 15.0 上工作。
由于主机和设备之间的多个副本重叠,aomp 14.0-2 带来了设备运行时性能改进。现在在其 openmp 库中还有一个静态构建的 hwloc,以支持使用“places”来获得 cpu 亲和性。aomp 14.0-2 的另一个特性是支持 openmp 中的内存管理分配。其他 aomp 14.0-2 更改包括许多修复。
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/yun129555.html