lazy喵学人工智障
Stephen Lucci 和 Danny Kopec 一起编写的《人工智能(第二版)》
郑泽宇等人合著的《TensorFlow:实战 Google 深度学习框架(第 2 版)》
1.动手跑起来:
通过现有开源的优秀项目进行学习(darknet YOLOv3)在下载到项目代码后首先要将该项目跑起来,通过跟踪数据在整个框架的流动大致掌握AI是怎么工作的,可以解决什么样的问题。同时在跑通搭建环境的过程中,可以快速掌握GPU跟深度学习框架是怎么结合起来工作的、深度学习框架在运行过程中需要有什么依赖。
2.原理掌握起来:
以YOLO进行学习,从推出至今已迭代到第四版本。掌握YOLO是如何演化的,分别作了哪些改进,改进为什么会起到性能提升的效果。
3.推理部署起来:
推理部署就是将深度学习框架训练好的模型部署到PC或者端测设备进行推理,解决实际的业务问题。这个过程主要包括模型性能调优,GPU或者D芯片的适配,业务逻辑的实现。对于模型性能调优,主要是将模型推理原有的FP32量化成FP16或者int8,从而实现推理加速,实现实时推理。这里推荐英伟达的TensorRT和华为的D芯片加速模块,它们会对模型做更高阶的优化,除了量化,还会有模型网络层之间的算子融合、kennel优化等