深度学习可以有三个维度进行分析:
0.AI芯片设计
名称再换,也不会超出状态机的概念;但指令和体系结构的设计会直接影响性能;功耗也是很重要的方面;
有时间关注下以地平线,寒武纪等为代表的AI芯片的设计理念;
1.深度学习框架搭建
(1)单机框架搭建
熟悉各组件的数学原理即可用c/c++/cuda写出基本模块的代码;
navie engine不需要进行优化,但主流框架都会有计算优化,比如mxnet的图染色; 参数输入是一个模块;
(2)分布式框架搭建
mxnet和tf都提供了分布式训练框架;
需要较强算法和系统设计经验,数学上能看懂原理;
2.深度学习训练领域模型
(1)cv领域:图像检测,关键点定位,跟踪,识别,图像理解,图像质量评估和增强,视频分析等方面;
(2)nlp;
(3)语音识别;
(4)搜索、推荐、排序;
需要较强的应用经验;