新书推荐 | 移动平台深度神经网络实战:原理、架构与优化

新书推荐

《移动平台深度神经网络实战:原理、架构与优化》

点击上图了解及购买

把智能装进移动端,开发移动平台人工智能系统解决方案!

视频介绍

编辑推荐

1. 业界专家联袂推荐,资深专家手把手教你开发移动平台人工智能系统

2. 精讲移动平台深度学习系统所需核心算法、硬件级指令集、系统设计与编程实战、海量数据处理、业界流行框架裁剪与产品级性能优化策略等

内容简介

本书精讲移动平台深度学习系统所需核心算法、硬件级指令集、系统设计与编程实战、海量数据处理、业界流行框架裁剪与产品级性能优化策略等,深入、翔实。

  • 深度学习基础(第1~4章),介绍开发机器学习系统所需重要知识点,以及开发移动平台机器学习系统算法基石,诸如人工神经网络、稀疏自编码器、深度网络、卷积神经网络等。

  • 移动平台深度学习基础(第5~6章),介绍移动平台开发环境搭建、移动平台开发基础、ARM指令集加速技术,以及轻量级网络的实现原理与实战。

  • 深入理解深度学习(第7~8章),剖析数据预处理原理与方法,高性能实时处理系统开发,以及基于深度神经网络的物体检测与识别。本篇是下一篇内容的前导与“基石”。

  • 深入理解移动平台深度学习(第9~12章),本篇应用前述章节的框架与技术,实现移动平台深度学习系统的实现与集成,具体涵盖:① 移动平台性能优化,数据采集与训练,为开发移动平台图像分类系统建立基础;② 深入剖析TensorFlow Lite代码体系、构建原理、集成方法以及核心代码与裁剪分析,模型处理工具,并完成移动平台系统集成;③ 结合实战分析主流移动平台机器学习框架、接口,并展望未来。

作者简介

卢誉声

Autodesk数据平台和计算平台资深工程师,负责平台架构研发工作。工作内容涵盖大规模分布式系统的服务器后端、前端以及SDK的设计与研发,在数据处理、实时计算、分布式系统设计与实现、性能调优、高可用性和自动化等方面积累了丰富的经验。擅长C/C++、JavaScript开发,此外对Scala、Java以及移动平台等也有一定研究。著有《移动平台深度神经网络实战:原理、架构与优化》、《分布式实时处理系统:原理架构与实现》,并译有《高级C/C++编译技术》和《JavaScript编程精解(原书第2版)》等。 

目录

序一

序二

前言

第一篇 深度学习基础

第1章 向未来问好  2

1.1 机器学习即正义  2

1.1.1 照本宣科  3

1.1.2 关键概念概述  4

1.1.3 数学之美  5

1.2 机器学习的场景和任务  6

1.3 机器学习算法  8

1.3.1 分类算法  8

1.3.2 回归算法  8

1.3.3 聚类算法  8

1.3.4 关联分析算法  9

1.3.5 集成算法  9

1.3.6 强化算法  10

1.4 如何掌握机器学习  10

1.4.1 学习曲线  10

1.4.2 技术栈  11

1.5 深度学习  12

1.5.1 深度学习的贡献  12

1.5.2 深度学习框架简介  13

1.5.3 安装使用深度学习框架  16

1.5.4 深度学习进展  22

1.6 走进移动世界的深度学习  25

1.6.1 移动平台机器学习概述  25

1.6.2 难度和挑战  26

1.7 本书框架  26

1.8 本章小结  27

第2章 机器学习基础  28

2.1 机器学习的主要任务  28

2.2 贝叶斯模型  29

2.3 Logistic回归  33

2.3.1 线性回归  33

2.3.2 几率与Logit  35

2.3.3 Logistic回归  38

2.3.4 背景溯源  39

2.3.5 实现Logistic回归  42

2.4 本章小结  44

第3章 人工神经网络  45

3.1 人工神经网络简介  45

3.2 基本结构与前向传播  46

3.2.1 神经元  46

3.2.2 连接与网络  47

3.2.3 神经网络向量化  48

3.2.4 前向传播  50

3.3 反向传播算法  50

3.4 实现前向神经网络  53

3.4.1 神经网络与前向传播实现  53

3.4.2 Softmax回归  60

3.5 稀疏自编码器  61

3.5.1 引子  61

3.5.2 自编码器简介  61

3.5.3 稀疏自编码算法  63

3.6 神经网络数据预处理  64

3.6.1 去均值  64

3.6.2 归一化  65

3.7 本章小结  65

第4章 深度网络与卷积神经网络  66

4.1 深度网络  66

4.1.1 自我学习  66

4.1.2 特征学习  67

4.1.3 深度神经网络  68

4.1.4 逐层贪婪训练方法  69

4.2 卷积神经网络  70

4.2.1 全连接与部分连接网络  70

4.2.2 卷积  70

4.2.3 池化  72

4.2.4 卷积神经网络  73

4.3 卷积神经网络实现  73

4.3.1 Layer实现  74

4.3.2 Net实现  79

4.3.3 InnerProduct实现  92

4.3.4 Convolution实现  95

4.3.5 Pooling实现  101

4.3.6 定义注册头文件  109

4.4 本章小结  110

第二篇 移动平台深度学习基础

第5章 移动平台深度学习框架设计与实现  112

5.1 移动平台深度学习系统开发简介  112

5.2 ARM Linux基础开发环境  113

5.2.1 通用ARM工具链安装  114

5.2.2 Android NDK安装  114

5.2.3 树莓派工具链安装  115

5.3 TensorFlow Lite介绍  115

5.3.1 TensorFlow Lite特性  115

5.3.2 TensorFlow Lite架构  116

5.3.3 TensorFlow Lite代码结构  117

5.4 移动平台性能优化基础  118

5.4.1 ARM v8体系结构  119

5.4.2 ARM v8数据类型与寄存器  120

5.4.3 Neon指令集介绍  122

5.4.4 ARM v8内存模型  124

5.4.5 Neon指令集加速实例  127

5.5 本章小结  140

第6章 移动平台轻量级网络实战  141

6.1 适用于移动平台的轻量级网络  141

6.2 SqueezeNet  142

6.2.1 微观结构  142

6.2.2 宏观结构  142

6.2.3 核心思路  143

6.2.4 实战:用PyTorch实现SqueezeNet  144

6.3 MobileNet  153

6.4 ShuffleNet  154

6.5 MobileNet V2  155

6.5.1 MobileNet的缺陷  155

6.5.2 MobileNet V2的改进  155

6.5.3 网络结构  156

6.5.4 实战:用PyTorch实现MobileNet V2  157

6.6 本章小结  161

第三篇 深入理解深度学习

第7章 高性能数据预处理实战  164

7.1 数据预处理任务  164

7.1.1 数据清理  165

7.1.2 数据集成  165

7.1.3 数据归约  165

7.1.4 数据变换  166

7.2 数据标准化  166

7.3 PCA  167

7.3.1 PCA的现实问题  167

7.3.2 PCA的计算方法  167

7.3.3 PCA的数学理论基础  169

7.4 在Hurricane之上实现PCA  170

7.4.1 Hurricane实时处理系统  171

7.4.2 实现Hurricane Topology  172

7.4.3 实现PCA  178

7.5 本章小结  192

第8章 基于深度神经网络的物体检测与识别  193

8.1 模式识别与物体识别  193

8.1.1 模式识别  193

8.1.2 模式识别系统  194

8.1.3 传统模式识别方法  194

8.1.4 深度学习模式识别方法  197

8.2 图像分类  197

8.2.1 LeNet  197

8.2.2 AlexNet  200

8.2.3 数据抓取整理  203

8.2.4 数据预处理  204

8.2.5 数据训练  206

8.3 目标识别与物体检测  207

8.3.1 目标识别简介  207

8.3.2 R-CNN  208

8.3.3 SPP-Net  209

8.3.4 Fast R-CNN  211

8.3.5 Faster R-CNN  211

8.3.6 RetinaNet  213

8.4 检测识别实战  213

8.4.1 Faster R-CNN  214

8.4.2 RetinaNet  230

8.5 移动平台检测识别实战  237

8.5.1 移动平台系统开发思路  237

8.5.2 基于RetinaNet的检测定位实现  237

8.5.3 基于AlexNet的识别分类实现  244

8.5.4 接口设计封装  247

8.6 本章小结  258

第四篇 深入理解移动平台深度学习

第9章 深入移动平台性能优化  260

9.1 模型压缩  260

9.2 权重稀疏化  262

9.2.1 Structured Sparsity Learning  262

9.2.2 Dynamic Network Surgery  262

9.2.3 Dynamic Network Surgery实现  264

9.3 模型加速  275

9.3.1 半精度与权重量化  275

9.3.2 深度压缩  276

9.3.3 二值化网络  278

9.3.4 三值化网络  280

9.3.5 DoReFa-Net  282

9.3.6 编程实战  283

9.4 嵌入式优化  287

9.4.1 算法局限与改进  287

9.4.2 理论改进  287

9.4.3 编程实战  288

9.5 嵌入式优化代码实现  290

9.5.1 量化分析实现  290

9.5.2 层实现  302

9.5.3 量化矩阵计算  309

9.6 本章小结  313

第10章 数据采集与模型训练实战  314

10.1 收集海量数据  314

10.1.1 搜索引擎工作原理  315

10.1.2 HTTP会话  316

10.1.3 解决JavaScript渲染问题  316

10.2 图片数据爬虫实现  317

10.2.1 获取任务  318

10.2.2 解析图片  320

10.2.3 图片存储  326

10.2.4 图片去重  327

10.2.5 完成Topology  328

10.3 训练与测试  330

10.3.1 模型定义  330

10.3.2 训练  334

10.3.3 测试  342

10.3.4 封装  344

10.4 本章小结  345

第11章 移动和嵌入式平台引擎与工具实战  346

11.1 TensorFlow Lite构建  346

11.2 集成TensorFlow Lite  357

11.3 核心实现分析  358

11.3.1 解释器代码分析  358

11.3.2 图代码分析  373

11.3.3 操作符注册  381

11.3.4 操作符扩展实现  384

11.3.5 计算与优化模块  399

11.4 模型处理工具  407

11.5 本章小结  425

第12章 移动平台框架与接口实战  426

12.1 Core ML  426

12.1.1 准备数据和生成模型  427

12.1.2 App实战:引入Core ML实现  430

12.2 Android Neural Networks API  437

12.2.1 等等,Google还有一个ML Kit  437

12.2.2 NNAPI编程模型  437

12.2.3 创建网络与计算  439

12.2.4 JNI封装与调用  451

12.2.5 App实战:集成NNAPI  454

12.3 实战:实现Android图像分类器App  459

12.3.1 JNI封装  459

12.3.2 Java调用  474

12.4 未来之路  479

12.5 本章小结  480

你与世界

只差一个

公众号

  • 0
    点赞
  • 0
    收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值