自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 基于Intel oneAPI的图像卷积并⾏加速

这个过程让我体会到了并行化对于提高大规模计算任务效率的重要性,且即便是Intel Devcloud Jupyter Notebook中提供的CPU资源,在应用并行加速后加速比也十分优秀。本项目实现了图像卷积的并行加速算法,其核心在于利用Intel oneAPI中的SYCL框架来实现高效的图像处理。在此作业中,我利用了oneAPI的SYCL扩展,它提供了一个标准的C++编程模型,卷积核应用:卷积核在每个像素位置上应用,对应位置的像素和卷积核中的值进行乘法运算后累加,得到输出图像的相应像素值。

2023-12-01 14:21:38 859 1

原创 基于Intel oneAPI的并⾏矩阵乘法

在此作业中,我利用了oneAPI的SYCL扩展,它提供了一个标准的C++编程模型,简化了在不同类型的处理器上编程的复杂性,且算法本身可以在不进行任何更改的情况下,支持异构计算,这种跨平台兼容性对于降本增效、优化性能至关重要。基于Intel oneAPI提供的并行计算接口,将原矩阵分成若干块,每块大小作为一个超参数指定,对于每个小块都可以并行处理,进行分块矩阵乘算法。我的作业中一共使用了3种不同的矩阵乘算法:朴素串行矩阵乘法、朴素并行矩阵乘法、分块并行矩阵乘法。接下来,对于运行效率,使用。

2023-12-01 14:08:36 942

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除