(图片付费下载自视觉中国)
整理 | 夕颜
出品 | AI科技大本营(ID:rgznai100)
【导读】 TensorFlow 2.0 于近期正式发布后,立即受到学术界与科研界的广泛关注与好评。此前,AI 科技大本营曾特邀专家回顾了 TensorFlow 2.0 从初版到最新版本的发展史。今天,我们将介绍一本全面详解 TensorFlow 2.0 的手册。这本手册是 Google Summer of Code 2019 项目之一,从基础安装与环境配置、部署,到大规模训练与加速、扩展,全方位讲解 TensorFlow 2.0 的入门要点,并附录相关资料供读者参考。
这是一本简明的 TensorFlow 2.0 入门指导手册,基于 Keras 和 Eager Execution(即时运行)模式,力图让具备一定机器学习及 Python 基础的开发者们快速上手 TensorFlow 2.0。
本手册的所有代码基于 TensorFlow 2.0 正式版及 beta1 版本。
中文指南:https://tf.wiki/
GitHub链接:https://github.com/snowkylin/tensorflow-handbook
文中的所有示例代码:https://github.com/snowkylin/tensorflow-handbook/tree/master/source/_static/code/zh
本手册所有章节如下图,不仅包含 TensorFlow 的概述,还含有基础、部署、大规模训练与加速、扩展,以及附录部分。
前言
此前,TensorFlow 所基于的传统 Graph Execution 的弊端,如入门门槛高、调试困难、灵活性差、无法使用 Python 原生控制语句等早已被开发者诟病许久。一些新的基于动态图机制的深度学习框架(如 PyTorch)也横空出世,并以其易用性和快速开发的特性而占据了一席之地。尤其是在学术研究等需要快速迭代模型的领域,PyTorch 等新兴深度学习框架已经成为主流。作者所在的数十人的机器学习实验室中,竟只有其一人 “守旧” 地使用 TensorFlow。
然而,直到目前,市面上相关的 TensorFlow 相关的中文技术书籍及资料仍然基于传统的 Graph Execution 模式,让不少初学者(尤其是刚学过机器学习课程的大学生)望而却步。由此,在 TensorFlow 正式支持 Eager Execution 之际,有必要出现一本全新的技术手册,帮助初学者及需要快速迭代模型的研究者,以一个全新的角度快速入门 TensorFlow。
同时,本手册还有第二个任务。市面上与 TensorFlow 相关的中文技术书籍大都以深度学习为主线,将 TensorFlow 作为这些深度学习模型的实现方式。这样固然有体系完整的优点,然而对于已经对机器学习或深度学习理论有所了解,希望侧重于学习 TensorFlow 本身的读者而言,就显得不够友好。
于是,作者希望编写一本手册,以尽量精简的篇幅展示 TensorFlow 作为一个计算框架的主要特性,并弥补官方手册的不足,力图能让已经有一定机器学习 / 深度学习知识及编程能力的读者迅速上手 TensorFlow,并在实际编程过程中可以随时查阅并解决实际问题。
适用群体
本书适用于以下读者:
-
已有一定机器学习 / 深度学习基础,希望将所学理论知识使用 TensorFlow 进行具体实现的学生和研究者;
-
曾使用或正在使用 TensorFlow 1.X 版本或其他深度学习框架(比如 PyTorch),希望了解 TensorFlow 2.0 新特性的开发者;
-
希望将已有的 TensorFlow 模型应用于业界的开发者或工程师。
提示
本书不是一本机器学习 / 深度学习原理入门手册。若希望进行机器学习 / 深度学习理论的入门学习,可参考附录中提供的一些入门资料。
TensorFlow 概述
-
学生和研究者:模型的建立与训练
-
开发者和工程师:模型的调用与部署
-
TensorFlow 能帮助我们做什么?
基础
-
TensorFlow 安装与环境配置
TensorFlow 的最新安装步骤可参考官方网站上的说明(https://tensorflow.google.cn/install)。TensorFlow 支持 Python、Java、Go、C 等多种编程语言以及 Windows、OSX、Linux 等多种操作系统,此处及后文均以 Python 3.7 为准。
提示
本章介绍在一般的个人电脑或服务器上直接安装 TensorFlow 2.0 的方法。关于在容器环境(Docker)、云平台中部署 TensorFlow 或在线上环境中使用 TensorFlow 的方法,见附录 使用 Docker 部署 TensorFlow 环境和在云端使用 TensorFlow 。软件的安装方法往往具有时效性,本节的更新日期为 2019 年 10 月。
-
-
一般安装步骤
-
GPU 版本 TensorFlow 安装指南
-
GPU 硬件的准备
-
NVIDIA 驱动程序的安装
-
CUDA Toolkit 和 cnDNN 的安装
-
-
第一个程序
-
IDE 设置
-
TensorFlow 所需的硬件配置 *
-
-
TensorFlow 基础
本章介绍 TensorFlow 的基本操作。
-
-
TensorFlow 1+1
-
自动求导机制
-
基础示例:线性回归
-
NumPy 下的线性回归
-
TensorFlow 下的线性回归
-
-
-
TensorFlow 模型建立与训练
本章介绍如何使用 TensorFlow 快速搭建动态模型。
-
-
模型(Model)与层(Layer)
-
基础示例:多层感知机(MLP)
-
数据获取及预处理:tf.keras.datasets
-
模型的构建:tf.keras.Model 和 tf.keras.layers
-
模型的训练:tf.keras.losses 和 tf.keras.optimizer
-
模型的评估:tf.keras.metrics
-
-
卷积神经网络(CNN)
-
使用 Keras 实现卷积神经网络
-
使用 Keras 中预定义的经典卷积神经网络结构
-
-
循环神经网络(RNN)
-
深度强化学习(DRL)
-
Keras Pipeline *
-
Keras Sequential/Functional API 模式建立模型
-
使用 Keras Model 的 compile 、 fit 和 evaluate 方法训练和评估模型
-
-
自定义层、损失函数和评估指标 *
-
自定义层
-
自定义损失函数和评估指标
-
-
-
TensorFlow 常用模块
-
tf.train.Checkpoint :变量的保存与恢复
-
TensorBoard:训练过程可视化
-
tf.data :数据集的构建与预处理
-
数据集对象的建立
-
数据集对象的预处理
-
数据集元素的获取与使用
-
实例:cats_vs_dogs 图像分类
-
-
@tf.function :Graph Execution 模式 *
-
@tf.function 基础使用方法
-
@tf.function 内在机制
-
AutoGraph:将 Python 控制流转换为 TensorFlow 计算图
-
使用传统的 tf.Session
-
-
tf.TensorArray :TensorFlow 动态数组 *
-
tf.config:GPU 的使用与分配 *
-
指定当前程序使用的 GPU
-
设置显存使用策略
-
单 GPU 模拟多 GPU 环境
-
-
部署
-
TensorFlow 模型导出
-
使用 SavedModel 完整导出模型
-
Keras Sequential save 方法(Jinpeng)
-
-
TensorFlow Serving
-
TensorFlow Serving 安装
-
TensorFlow Serving 模型部署
-
Keras Sequential 模式模型的部署
-
自定义 Keras 模型的部署
-
-
在客户端调用以 TensorFlow Serving 部署的模型
-
Python 客户端示例
-
Node.js 客户端示例(Ziyang)
-
-
-
TensorFlow Lite(Jinpeng)
-
模型转换
-
Android 部署
-
Quantization 模型转换
-
总结
-
-
TensorFlow in JavaScript(Huan)
-
TensorFlow.js 简介
-
浏览器中使用 TensorFlow.js 的优势
-
TensorFlow.js 性能对比
-
-
TensorFlow.js 环境配置
-
在浏览器中使用 TensorFlow.js
-
在 Node.js 中使用 TensorFlow.js
-
在微信小程序中使用 TensorFlow.js
-
-
TensorFlow.js 模型部署
-
通过 TensorFlow.js 加载 Python 模型
-
使用 TensorFlow.js 模型库
-
-
TensorFlow.js 模型训练 *
-
大规模训练与加速
-
TensorFlow 分布式训练
当我们拥有大量计算资源时,通过使用合适的分布式策略,可以充分利用这些计算资源,从而大幅压缩模型训练的时间。针对不同的使用场景,TensorFlow 在 tf.distribute.Strategy 中为我们提供了若干种分布式策略,从而能够更高效地训练模型。
-
-
单机多卡训练:MirroredStrategy
-
多机训练:MultiWorkerMirroredStrategy
-
-
使用 TPU 训练 TensorFlow 模型(Huan)
2017 年 5 月,Alpha Go 在中国乌镇围棋峰会上,与世界第一棋士柯洁比试,并取得了三比零全胜战绩。之后的版本 Alpha Zero 可以通过自我学习 21 天即可以达到胜过中国顶尖棋手柯洁的 Alpha Go Master 的水平。
Alpha Go 背后的动力全部由 TPU 提供,TPU 使其能够更快地 “思考” 并在每一步之间看得更远。
-
TPU 简介
-
什么是 TPU
-
为什么使用 TPU
-
TPU 性能
-
-
TPU 环境配置
-
免费 TPU:Google Colab
-
Cloud TPU
-
-
TPU 基础使用
扩展
-
TensorFlow Hub 模型复用(Jinpeng)
-
TensorFlow Datasets 数据集载入
-
Swift for TensorFlow (S4TF) (Huan)
-
S4TF 简介
-
为什么要使用 Swift 进行 Tensorflow 开发
-
-
S4TF 环境配置
-
本地安装 Swift for Tensorflow
-
在 Colaboratory 中快速体验 Swift for Tensorflow
-
在 Docker 中快速体验 Swift for TensorFlow
-
-
S4TF 基础使用
-
在 Swift 中使用标准的 TensorFlow API
-
在 Swift 中直接加载 Python 语言库
-
语言原生支持自动微分
-
MNIST 数字分类
-
-
-
TensorFlow in Julia(Ziyang)
-
TensorFlow.jl 简介
-
为什么要使用 Julia ?
-
-
TensorFlow.jl 环境配置
-
在 docker 中快速体验 TensorFlow.jl
-
在 julia 包管理器中安装 TensorFlow.jl
-
-
TensorFlow.jl 基础使用
-
MNIST 数字分类
-
-
附录
-
图模型下的 TensorFlow
-
TensorFlow 1+1
-
基础示例:线性回归
-
-
使用 Docker 部署 TensorFlow 环境
-
在云端使用 TensorFlow
-
在 Colab 中使用 TensorFlow
-
在 Google Cloud Platform(GCP)中使用 TensorFlow
-
在 Compute Engine 建立带 GPU 的实例并部署 TensorFlow
-
使用 AI Platform 中的 Notebook 建立带 GPU 的在线 JupyterLab 环境
-
-
在阿里云上使用 GPU 实例运行 Tensorflow(Ziyang)
-
-
部署自己的交互式 Python 开发环境 JupyterLab
-
TensorFlow 性能优化
-
参考资料与推荐阅读
-
术语中英对照表
答疑区
-
(中文)TensorFlow 中文社区 “简单粗暴 TensorFlow” 版面:https://www.tensorflowers.cn/b/48 (中文的疑问和建议请来此处,将以中文回答和讨论。欢迎使用中文的开发者们前来 TensorFlow 中文社区交流讨论)
-
(英文)https://github.com/snowkylin/tensorflow-handbook/releases (英文的疑问或建议可在 GitHub issue 中提出,会以英文回答)
PDF 下载(旧版):
-
中文版:https://www.tensorflowers.cn/t/6230 (同时也有英文版下载)
-
英文版:https://github.com/snowkylin/tensorflow-handbook/releases
搜索页面:https://tf.wiki/search.html
作者乃北大学霸
最后,我们有必要介绍一下《简单粗暴TensorFlow 2.0》的作者李锡涵。
(图片来源:领英)
据领英资料显示,李锡涵是来自北大信息科学技术学院的准理科硕士生,担任见习顾问和研究助理,2016年本科毕业于浙大竺可桢学院,并在 2015 年以交换生的身份进入交通大学。
李锡涵曾在微软亚研院机器学习组实习,在谷歌还是机器学习方面的GDE(Google Developers Expert),目前的研究重点是基于图的现实场景中多主体强化学习的应用。
(*本文为 AI科技大本营整理文章,转载请微信联系 1092722531)
精彩推荐
早鸟票倒计时最后1天,扫码购票立减2600元!
2019 中国大数据技术大会(BDTC)再度来袭!豪华主席阵容及百位技术专家齐聚,15 场精选专题技术和行业论坛,超强干货+技术剖析+行业实践立体解读,深入解析热门技术在行业中的实践落地。