如何使用C++ AMP在Windows上进行GPU并行计算? (微软GPGPU)

C++ AMP 在 Windows 上已彻底不可用——VS 2025 起移除 amp.h 和运行时,concurrency 命名空间被剥离,无兼容 workaround;推荐迁移到 SYCL、CUDA、DirectML 或 Vulkan Compute。

Windows 上用 C++ AMP 做 GPU 并行计算,现在基本不可行——Microsoft 已在 Visual Studio 2025 中彻底移除对 AMP 的支持,且不再维护 amp.h 和相关运行时。

VS 2025 及以后版本无法编译 concurrency::parallel_for_each

从 Visual Studio 2025 17.0 开始,amp.h 头文件被删除,链接器找不到 msvcpampd.libmsvcpamp.lib,所有含 concurrency::arrayconcurrency::accelerator 的代码会报错:

error C1189: #error:  The C++ AMP runtime is no longer supported.

即使你强行复制旧版头文件或 lib,也会因 ABI 不兼容、驱动层缺失(WDDM 2.7+ 不再暴露 AMP 兼容接口)而失败。

  • VS 2019 是最后一个完整支持 C++ AMP 的官方版本(需安装“C++ AMP”可选组件)
  • 仅限 Windows 10/11 + WDDM 驱动显卡(NVIDIA/AMD/Intel 核显均可,但需支持 DirectCompute 11.0+)
  • 不支持 Windows Subsystem for Linux(WSL)、ARM64 或远程桌面会话中的 GPU 加速

concurrency::arrayconcurrency::array_view 的替代方案已失效

过去常用 array 在 GPU 上分配二维数据,配合 parallel_for_each 执行 kernel。现在这些类型在新工具链中直接未定义:

#include 
using namespace concurrency;

array a(1024, 1024); // error C3093: 'array' is not a member of 'concurrency'

原因不是语法问题,而是整个命名空间 concurrency 已从标准库和运行时中剥离。没有 workaround 能绕过这一事实性移除。

  • array_view 曾用于零拷贝映射主机内存,但它依赖 AMP 运行时的同步机制,该机制已被弃用
  • 即使降级到 VS 2019,也无法在 Windows 11 22H2+ 上启用某些新显卡(如 RTX 40 系列)的 AMP 后端,因为驱动已移除对应 WDDM 接口

当前可行的 Windows GPGPU 替代路径

如果你需要在 Windows 上做 GPU 并行计算,应转向现代、受支持的标准:

  • CUDA:仅限 NVIDIA GPU,用 nvcc 或 clang + __global__,需安装 CUDA Toolkit
  • SYCL:跨平台(Intel oneAPI DPC++、hipSYCL),Windows 支持良好,用 queue.submit() + parallel_for
  • Vulkan Compute Shaders:底层灵活,但需手动管理内存与同步,适合已有图形管线项目
  • DirectML:微软官方推荐,专为机器学习推理优化,支持 CPU/GPU/NPU,C++ API 稳定

例如 SYCL 最小示例(使用 Intel DPC++ 编译器):

#include 
int main() {
  sycl::queue q;
  const int N = 1024;
  std::vector h_a(N, 1.0f), h_b(N, 2.0f), h_c(N);
  {
    sycl::buffer d_a(h_a.data(), sycl::range(N));
    sycl::buffer d_b(h_b.data(), sycl::range(N));
    sycl::buffer d_c(h_c.data(), sycl::range(N));
    q.submit([&](sycl::handler& h) {
      sycl::accessor a(d_a, h, sycl::read_only);
      sycl::accessor b(d_b, h, sycl::read_only);
      sycl::accessor c(d_c, h, sycl::write_only);
      h.parallel_for(sycl::range(N), [=](sycl::id<1> i) {
        c[i] = a[i] + b[i];
      });
    });
  }
}

C++ AMP 是一个已被归档的技术,它的核心限制(仅 Windows、仅 WDDM、无跨厂商标准)决定了它无法演进。现在硬要复用旧代码,不如直接迁移——尤其要注意 accelerator::default_accelerator 这类枚举值,在新生态里根本不存在对应概念。