自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 SYCL作业五:使用USM统一共享内存完成矩阵乘法

隐式数据移动情况下,对于小规模矩阵,GPU 的性能相对较好,但随着矩阵大小增加,GPU 相对于 CPU 的性能提升逐渐减缓。显示数据移动情况下,GPU 的性能在中等大小的矩阵上相对较好,但在较小和较大矩阵上可能不如 CPU。这是因为显示数据移动涉及显式地将数据从主机(CPU)传输到设备(GPU)。在大规模矩阵上,GPU 的性能提升可能会受到内存传输带宽等因素的限制,导致相对较慢的性能。选择隐式数据移动还是显示数据移动取决于问题的特定要求以及矩阵的大小。

2023-12-12 17:38:14 1003 1

原创 SYCL作业一:并行矩阵乘法

提高矩阵乘法效率的主要核心是并行计算。矩阵分块乘法将我们最后将要得到的矩阵按照一个给定的大小进行分块,每一个块的结果运算都是独立的,只需要从要相乘的两个矩阵中获取相应数据计算即可得出结果,每个块之间不会相互影响结果,所以可以在GPU上并行计算执行这些矩阵块,从而可以实现并行矩阵乘法,提高矩阵乘法的效率,缩减运行时间。

2023-11-30 12:08:24 1028

原创 2023年英特尔oneAPI校园Mini黑客松竞赛参赛作品——“BM3D优化加速”

西南石油大学:龙井湖。

2023-10-25 13:23:55 220 3

原创 C++与SYCL异构编程学习(二)

Data Parallel C++ 第一章 介绍

2023-07-11 15:30:28 357 3

原创 Oneapi--C++与SYCL异构编程学习 (一)

Oneapi的核心是一个名为DPC++的编程语言,DPC++本质上是添加对sycl的支持是对c++的扩展......

2023-07-10 17:00:32 495 1

原创 并行程序设计学习笔记(一)

并行程序设计导论学习笔记

2022-10-13 16:54:39 686 2

原创 有趣的博弈(先手后手问题)

巴什博弈,尼姆博弈,阶梯博弈,斐波那契博弈等博弈内容及其证明过程

2022-09-09 23:49:48 2491 3

原创 【数论】贝祖定理及其证明

在贝祖定理中给出了以下定义对于整数a和b及其最大公约数c,可以得出对于任意的整数x和y使得ax+by等于c的整数倍,且存在x和y使得ax+by等于c。当a和b互质时存在唯一的一组x,y使ax+by=1;不难看出 贝祖定理和最大公约数有关,而最大公约数也就和欧几里得算法(辗转相除法),我们也就可以用辗转相除法来证明贝祖定理证明分两种情况第一种情况:a与b当中有存在一个数为零时不妨设a为零,那么a与b的最大公约数c也就为b,不难得出ax+by=c的整数倍第二种情况:a与b都不为零

2022-04-22 00:06:00 5958 2

原创 有根树的表达——树结构的建立

树结构是一种数据结构,它由结点,以及连接结点的边构成。图中的圆圈表示节点,线表示边。若图中有一个名为“根”的特殊节点,那么这颗树可以被可以称为有根树。树中节点与节点之间具有父子关系,图中由边连接着的两个节点1与节点2中节点1被称作为节点2的父节点,节点2为节点1的子节点。图中有一个节点没有父节点该结点被称为根,图中蓝色结点1就为根。同时我们引入左子右兄弟概念,如图结点2,3,4同时与节点1连接 节点2为节点1的子节点 节点3为节点2的兄弟节点 节点4为节点3的兄弟节点 如节点2又连接着节点5,6

2022-04-04 15:23:58 2111 1

原创 深度优先搜索——采药的最短路径

题目描述少年李逍遥的婶婶病了,王小虎介绍他去一趟仙灵岛,向仙女姐姐要仙丹救婶婶。孝顺的李逍遥闯进了仙灵岛,克服了千险万难来到岛的中心,发现仙药摆在了迷阵的深处。迷阵由M×N个方格组成,有的方格内有可以瞬秒李逍遥的怪物,而有的方格内则是安全。现在李逍遥想尽快找到仙药,显然他应避开有怪物的方格,并经过最少的方格,而且那里会有神秘人物等待着他。现在要求你来帮助他实现这个目标。输入描述第1行输入两个非零整数 M 和 N ,两者均不大于20。M 表示迷阵行数, N 表示迷阵列数。接下来有 M 行, 每行包含N

2022-03-23 19:43:40 1108

原创 Floyd算法——解决多源最短路径

Floyd算法又被称为插点法,是利用动态规划的思想在给定的加权图中寻找多源点之间最短路径的方法。在此算法中每个点都是潜在的中转站,也就是每个点都可能对另外两个点之间的最短路径造成影响。通常在处理问题的时候采用一维数组来储存每个单独的点的位置数据,同时生成邻接数组来记录每个点初始距离数据,之后每个领接数组的点都会进行n次试探(此时的n为问题当中给出的数据个数)用来判断两个点之间最小距离是原始值还是有某个点可以作为中转站使得距离比原始值更小。这里用一道题来说明「一本通 1.2 练习 2」扩散

2022-03-15 19:32:00 783 1

原创 Codeforces:Burglar and Matches

题目链接原文大概意思是一个小偷有一个容量为n的包包,然后他去偷火柴,火柴盒分布于m个区域,每个区域有ai个火柴盒,每个火柴盒里有bi个火柴。然后要求聪明的你求出这个笨蛋小偷能够拿到多少个火柴。思路很简单只需要将每个区域的火柴盒进行排序即可,区域中每个火柴盒里火柴多的排在前面。然后使用结构体将两个变量作为一个整体讨论同时便于排序#include<bits/stdc++.h>using namespace std;int n,m;struct pp{ int a,b;}i[

2022-03-10 00:07:42 113 1

原创 「一本通 1.2 练习 1」数列分段 II

题目链接http://ybt.ssoier.cn:8088/problem_show.php?pid=1436题目要求每段和最大值最小这是最大化最小值情况很明显的二分题目再借用贪心思想 在数组中选取片段时只需要满足当前片段的值是小于mid值的最大片段即可也就是当前的片段再加上数组下一位的数时的片段的值是大于mid值的#include<bits/stdc++.h>using namespace std;int main(){ int ans,n,m,i[100005]; c

2022-03-09 17:37:24 352

原创 「一本通 1.2 例 2」Best Cow Fences

题目链接:链接: [link](信息学奥赛一本通(C++版)在线评测系统).首先这道题要求找平均数,且要求所选片段长度需要大于等于l。那么首先想到的就是最暴力的方法就是找到所有大于等于l的片段在其中找到最大的平均数,这显然没理解到出题人的要求。思路:首先这道题很明显有个明确的要求就是找到一个平均值且有明显的分界点。分界点就是若当前所有大于等于l的片段的平均值都小于当前找到的这个平均值那么当前的这个平均值就大了,若当前所有大于等于l的片段存在大于等于当前的这个平均值那么就可以继续寻找下一个更大的平

2022-03-04 21:07:53 642 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除