linux cpu gpu copy,一种基于Linux的片上CPU/GPU流水化计算方法及计算机系统与流程

技术特征:

1.一种基于linux的片上cpu/gpu流水化计算方法,其特征在于,包括步骤:

s1,根据预设的任务依赖算法以及任务的执行类型对所述任务进行排序,对排序后的所述任务按照流水线最大利用率进行重排序,其中所述执行类型包括并行计算型任务,以及串行、io或者逻辑型任务;

s2,对缓存进行缓存状态查询,在对所述缓存发起写请求任务完成后进行缓存刷新;

s31,根据gpu计算核心的计算状态以及所述任务的重排序结果,在所述gpu计算核心空闲时,将所述任务中的所述并行计算型任务派发给所述gpu计算核心;

s32,根据cpu计算核心的计算状态以及所述任务的重排序结果,在所述cpu计算核心空闲时,将所述任务中的所述串行、io或者逻辑型任务派发给所述cpu计算核心;

s4,将所述gpu计算核心处理的任务数据和所述cpu计算核心处理的任务数据规约到对应的发起cpu中,由cpu进行后续数据处理。

2.如权利要求1所述的基于linux的片上cpu/gpu流水化计算方法,其特征在于,所述步骤s1具体包括:

根据所述预设的任务依赖算法对所述任务绘制任务图,对所述任务图进行拓扑排序;

根据所述任务的所述执行类型,将所述拓扑排序后的所述任务中的所述串行、io或者逻辑型任务存入cpu任务队列,以及将所述拓扑排序后的所述任务中的所述并行计算型任务存入gpu任务队列;

对排序后的所述cpu任务队列以及所述gpu任务队列按照流水线最大利用率进行重排序。

3.如权利要求2所述的基于linux的片上cpu/gpu流水化计算方法,其特征在于,所述gpu任务队列中的任务的任务优先级高于所述cpu任务队列中任务的任务优先级;所述gpu任务队列中的任务的发射优先级高于所述cpu任务队列中任务的发射优先级。

4.如权利要求2所述的基于linux的片上cpu/gpu流水化计算方法,其特征在于,所述步骤s31中包括:

判断所述cpu计算核心中的发射cpu核心是否空闲、判断系统共享内存是否足够且存在空余内存带宽、以及判断所述gpu计算核心中的流处理器是否空闲;

在所述发射cpu核心空闲、所系统共享内存足够且存在空余内存带宽、或者所述gpu计算核心中的流处理器空闲三个条件中至少一个满足时,将所述gpu任务中的所述并行计算型任务通过所述发射cpu核心派发给所述gpu计算核心。

5.如权利要求4所述的基于linux的片上cpu/gpu流水化计算方法,其特征在于,所述判断所述cpu计算核心中的发射cpu核心是否空闲以及判断所述gpu计算核心中的流处理器是否空闲的步骤,具体包括:

依次查询所述cpu计算核心以及所述gpu计算核心的五级流水信息;

根据所述cpu计算核心的五级流水信息,所述gpu计算核心的五级流水信息,以及所述五级流水信息中任务的依赖关系判断所述cpu计算核心中的发射cpu核心是否空闲和判断所述gpu计算核心中的流处理器是否空闲。

6.如权利要求4所述的基于linux的片上cpu/gpu流水化计算方法,其特征在于,所述判断系统共享内存是否足够且存在空余内存带宽的步骤中通过性能监视器计数器统计从上一个tick标记到当前tick标记的两级缓存未命中数来计算所述内存带宽。

7.如权利要求1-6中任一项所述的基于linux的片上cpu/gpu流水化计算方法,其特征在于,所述步骤s2包括:

在存在有所述gpu计算核心在计算流水线中时,对所述gpu计算核心所执行的当前任务中的数据从所述cpu写入内存和数据从所述gpu写入内存的阶段,对所述cpu对应的缓存以及所述gpu对应的二级缓存各进行一次缓存状态查询;

在所述gpu计算核心所执行的所述当前任务中的数据从所述cpu写入内存和数据从所述gpu写入内存的阶段的写请求任务完成后进行缓存刷新,以保证任务数据的缓存一致性。

8.如权利要求1-6中任一项所述的基于linux的片上cpu/gpu流水化计算方法,其特征在于,在所述cpu包括n核{k0,k1,...kn}所述cpu计算核心时,固定并优先使用所述k0cpu计算核心作为所述gpu的发射cpu核心;其中,所有所述cpu计算核心具备所述gpu任务发射功能。

9.一种计算机系统,其特征在于,包括:

任务仲裁模块,用于根据预设的任务依赖算法以及任务的执行类型对所述任务进行排序,对排序后的所述任务按照流水线最大利用率进行重排序,其中所述执行类型包括并行计算型任务,以及串行、io或者逻辑型任务;

缓存一致性刷新模块,用于对缓存进行缓存状态查询,在对所述缓存发起写请求任务完成后进行缓存刷新;

任务调度模块,包括gpu任务调度单元以及cpu任务调度单元,所述gpu任务调度单元用于根据gpu计算核心的计算状态以及所述任务的重排序结果,在所述gpu计算核心空闲时,将所述任务中的所述并行计算型任务派发给所述gpu计算核心;

所述cpu任务调度单元,用于根据cpu计算核心的计算状态以及所述任务的重排序结果,在所述cpu计算核心空闲时,将所述任务中的所述串行、io或者逻辑型任务派发给所述cpu计算核心;

规约模块,用于将所述gpu计算核心处理的任务数据和所述cpu计算核心处理的任务数据规约到对应的发起cpu中,由cpu进行后续数据处理。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述的基于linux的片上cpu/gpu流水化计算方法的步骤。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值