自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 GEMM矩阵相乘与深度学习

GEMM矩阵相乘与深度学习1. GEMM矩阵相乘1.1 GEMM算法基础1.2 GEMM算法优化1.2.1 循环重排充分利用缓存1.2.2 平铺(Tiling)充分利用缓存1.2.3 展开(Unrolling)1.2.4 内存对齐1.2.5 向量化1.2.6 矩阵分块1.2.7 双缓冲2. GEMM与卷积计算2.1 计算卷积的方法2.2 Img2col2.2.1 CNN中张量的存储2.2.2 卷积运算转化为GEMM1. GEMM矩阵相乘1.1 GEMM算法基础  GEMM(General Matrix

2020-07-08 21:10:41 4746 2

原创 GPU与cuda

GPU与cudaGPU1. GPU的历史1.1 NVidia GPU架构发展史2. GPU的结构2.1 功能单元2.2 几种架构特性简介2.3 具体的几种微观架构3. GPU执行模型3.1 SIMT3.2 线程级别的映射3.3 编译cuda1. CUDA简介1.1 GPU和CPU1.2 可伸缩Scaleable的编程模式2. CUDA编程模型2.1 CUDA编程模型中的概念2.1.1 Kernel2.1.2 Thread Hierarchy2.1.3 索引和ID2.1.4 同步和原子2.2 CUDA的内存模

2020-07-08 20:53:53 2637

原创 并行编程模型之Actor/CSP/PGAS

并行编程模型之Actor/CSP/PGASActor1.背景2. 简介3.actor组成ActorMailbox邮箱behavior行为4.优势无锁异步隔离容错分布式5.劣势6.实践素数计算CSP1.简介2.CSP与go语言2.1 组成2.2Goroutine调度器3.Actor模型和CSP模型的区别PGAS1.简介2.实现Actor1.背景  处理并发问题就是如何保证共享数据的一致性和正确性,一般来说有两种策略用来在并发线程中进行通信:共享数据和消息传递。  熟悉c和java并发编程的都会比较熟悉

2020-07-08 20:13:35 2116

原创 C++与序列化

协议/protobuf

2020-06-15 23:37:34 3828

原创 C++20中的新特性

C++20

2020-06-14 10:47:12 3456 2

原创 C++与协程

协程

2020-06-14 10:46:52 668

原创 几个常用的boost对象

shared_from_this

2020-06-11 22:20:34 365

原创 Linux设备树与平台总线模型

linux内核platform驱动模型

2020-06-11 22:20:15 1317

原创 Linux时钟与定时器

定时器

2020-06-08 18:35:00 1340

原创 类型无关链表与Linux内核对象管理

linux内核链表与kobject

2020-06-08 18:34:50 189

原创 Linux进程间的通信

程序间的通信

2020-06-08 18:34:39 866

原创 地址空间与内存分配

C/C++内存池

2020-06-08 18:33:34 1136

原创 并发网络编程设计

网络编程模型

2020-06-08 18:33:22 265

原创 Linux线程私有数据

Linux线程特定数据

2020-06-08 18:33:01 352

原创 C++ traits与模板递归

C++模板递归与traits

2020-06-08 18:32:43 459

原创 原子操作

原子操作定义实现总结定义 所谓原子操作,就是“不可中断的一个或一系列操作”单核CPU: 在单核CPU中,能够在一条指令中完成的操作都可以看作为原子操作。无论是设备中断请求、时间片超时、程序主动schedule放弃CPU,抑或是发生抢占,从而引起线程调度中断当前程序操作,都是发生在指令间的。计算机的每条指令的执行天生就是原子性不可中断的,这是由硬件设计决定的。 对程序而言,一条语句对应几条指令,是由编译器、指令集(或者说硬件架构设计)决定的,即是由软件硬件共同决定。编译器决定了上层语言被翻

2020-06-08 18:32:11 1877

原创 开发辅助工具

个人开发辅助记录git常用命令error解决makefileCMakeAndroid.mkKConfigVSCodegit常用命令拉取常用 git pull git rebase --abort本地常用 git add (-u) * git checkout -- git commit (--amend -s) git reset --soft HEAD^ git reset --hard (commit_id) git stash git stash pop gi

2020-06-08 18:24:59 374

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除