自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 基于因特尔的大模型加速技术实践

文件中提到的技术细节主要围绕深度学习模型的优化,特别是针对英特尔平台的优化。

2024-05-17 00:48:11 580

原创 基于因特尔oneAPI的并行矩阵乘法算法实现

4.并行计算:在核函数处理中,每个输出的元素都是每个线程单独计算得到的,考虑到矩阵的结构和最大限度利用GPU的并行计算能力,考虑使用二维线程块和线程网络的方式来处理矩阵乘法。利用buffer可以创建在设备和主机上传输数据的缓冲区,利用accessor可以在内核中访问缓冲区的数据,并且有read_only和write_only两种模式。队列是一种机制,将工作提交给设备,利用queue完成定义,通过submit提交,其中包含计算的具体实现方式和核函数等。2.数据传输:将输入的矩阵数据从主机端输入到GPU端中。

2023-12-03 13:53:42 27 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除