C++17 并行排序初体验

MSVC篇

微软在2018年9月份发布博客Using C++17 Parallel Algorithms for Better Performance宣布正式支持C++17的并行算法。它的使用方法和C++17标准基本一致,不用作太多改动。

由于多核会让clock_t多次累计,因此计时得换用chrono提供的时间函数。至于究竟使用high_resolution_clock还是system_clock倒是无所谓,因为我们测试数据量较大,用时相对会长一点。

最亮眼的一句是:

#include <execution>
复制代码

有了它之后就可以发挥多核计算的性能了。由于没有在Windows的较高机器配置,仅仅测试了小数据量情况,一次顺利通过。

ICC篇

为了在Mac上体验C++17的并行新特性,我申请了教育版套装Intel® Parallel Studio XE 2019,其中包含了Intel® C++ Compiler 19.0 for macOS。虽然也有很多使用的曲折,但感觉它将来可以做得更完善一些。

这个编译器使用很简单,参考安装路径下的这篇帮助即可:

opt/intel/documentation_2019/en/compiler_c/ps2019/get_started_mc.htm
复制代码

使用C++编译器:

icpc source.cpp
复制代码

要想体验并行,可以根据这篇Get Started with Parallel STL的指点配置。使用上基本上都遵循了C++17标准,但是包含头文件得加上pstl。比如要使用并行的算法algorithm,在原始的头文件基础上还得追加:

#include <pstl/execution>
#include <pstl/algorithm>
复制代码

这点和标准不太一致。

我们考虑对10亿个double型随机数进行排序,采用均匀分布。一行代码即可:

std::sort(std::execution::par, V.begin(), V.end());
复制代码

实测速度是非常的惊人:11秒!

由于使用了并行排序,实际占用内存量会更大且每次执行不同,但不会超过原有向量两倍也即15GB。这说明了内存很重要。

其他

clang和gcc:得加油,得加油,得加油。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值