笔记
Poet__
这个作者很懒,什么都没留下…
展开
-
TVM,我不懂
1,谈背景,也就是谈有什么诉求或者痛点,然后产生了TVMcaffe 等深度学习框架在不同的硬件架构上需要写不同的算子。以前开发人员写算子的时候,要写cpu版本啊,GPU版本啊。现在有个想法,我们能不能写一次就行了。期望存在一个中间层,可以将前端的表达式(算子),转换成适配于硬件架构,这个算法设计人员不需要重复劳作以及减少算法设计难度。TVM应运而生了。2,组成TVM 最上层是简易的算法表达...原创 2020-04-12 00:09:20 · 332 阅读 · 0 评论 -
《并行算法设计与性能优化》——简单理解
前言,下周开始将会开启新一段旅程,并行计算的领域。对未来的憧憬,都是假象;前期的技术累计,也不一定用的上。现在年纪大了,没有年轻的时候,有那么多的试错机会,评估所有的成分。当然,这个开篇,其实就是打算写一个系列出来,重点还是刘工的并行计算加速,也是浅尝辄止,希望从宏观的角度去了解并行计算的领域。...原创 2020-04-06 20:00:25 · 808 阅读 · 0 评论 -
ELF
学名:可执行链接文件背景:(为什么需要这个文件)在linux系统,程序执行依赖于Cpu,程序加载存储是在内存中。诉求:有个设计,就是讲程序运行的命令和数据赋予某个载体中 这样我们可以控制程序的加载或者卸载。这样让系统就有灵活性。ELF就应运而生了。ELF设计包括文件头,段,section分布;如何创造main.cpp 汇编代码 .o(可充定位文件) 可执行文件或者共享文件.so...原创 2020-02-22 12:14:18 · 377 阅读 · 0 评论 -
谈谈对锁的理解
1.目的: 为什么要上锁,主要还是多线程的原因。多线程可能对同一块数据同时操作,数据可能会异常,比如,一个map,A线程对键值对删除2.3.原创 2020-02-01 00:11:55 · 2155 阅读 · 0 评论