【Tensorflow教程笔记】使用 TPU 训练 TensorFlow 模型

最新推荐文章于 2024-03-21 09:35:04 发布

_APTX4869

最新推荐文章于 2024-03-21 09:35:04 发布

阅读量5.9k

点赞数 3

分类专栏： Tensorflow

本文链接：https://blog.csdn.net/nanke_4869/article/details/114293867

版权

Tensorflow教程笔记

基础
TensorFlow 基础
 TensorFlow 模型建立与训练
 基础示例：多层感知机（MLP）
卷积神经网络（CNN）
循环神经网络（RNN）
深度强化学习（DRL）
Keras Pipeline
自定义层、损失函数和评估指标
 常用模块 tf.train.Checkpoint ：变量的保存与恢复
 常用模块 TensorBoard：训练过程可视化
 常用模块 tf.data ：数据集的构建与预处理
 常用模块 TFRecord ：TensorFlow 数据集存储格式
 常用模块 tf.function ：图执行模式
 常用模块 tf.TensorArray ：TensorFlow 动态数组
 常用模块 tf.config：GPU 的使用与分配
部署
TensorFlow 模型导出
 TensorFlow Serving
TensorFlow Lite
使用 TPU 训练 TensorFlow 模型
大规模训练与加速
TensorFlow 分布式训练
 使用 TPU 训练 TensorFlow 模型
扩展
TensorFlow Hub 模型复用
 TensorFlow Datasets 数据集载入
附录
强化学习基础简介

TPU 简介

什么是 TPU

TPU 代表 Tensor Processing Unit (张量处理单元) ，是由谷歌在 2016 年 5 月发布的为机器学习而构建的定制集成电路（ASIC），并为 TensorFlow 量身定制。

早在 2015 年，谷歌大脑团队就成立了第一个 TPU 中心，为 Google Translation，Photos 和 Gmail 等产品提供支持。为了使所有数据科学家和开发人员能够访问此技术，不久之后就发布了易于使用，可扩展且功能强大的基于云的 TPU，以便在 Google Cloud 上运行 TensorFlow 模型。

TPU 由多个计算核心（Tensor Core）组成，其中包括标量，矢量和矩阵单元（MXU）。TPU（张量处理单元）与 CPU（中央处理单元）和 GPU（图形处理单元）最重要的区别是：TPU 的硬件专为线性代数而设计，线性代数是深度学习的基石。在过去几年中，Google TPU 已经发布了 v1，v2，v3, v2 Pod, v3 Pod, Edge 等多个版本：
在这里插入图片描述

1 Tera: 万亿，10 的 12 次方
1 Peta: 千万亿，10 的 15 次方
1 FLOPS：每秒浮点数计算次数（FLoating-point Operations Per Second）
1 OPS: 每秒位整数计算次数（Integer Operations Per Second）

基于 Google Cloud，TPU 可以方便的进行建立和使用。同时，Google 也推出了专门为边缘计算环境而部署的 Edge TPU。Edge TPU 尺寸小，功耗低，性能高，可以在边缘计算环境中广泛部署高质量的 AI。其作为 Cloud TPU 的补充，可以大大促进 AI 的解决方案在 IoT 环境中的部署。

为什么使用 TPU

通过使用 Cloud TPU ，我们可以大大提升 TensorFlow 进行机器学习训练和预测的性能，并能够灵活的帮助研究人员，开发人员和企业 TensorFlow 计算群集。

根据 Google 提供的数据显示，在 Google Cloud TPU Pod 上可以仅用 8 分钟就能够完成 ResNet-50 模型的训练。

ResNet-50

在这里插入图片描述

TPU 性能

根据研究显示，TPU 比现代 GPU 和 CPU 快 15 到 30 倍。同时，TPU 还实现了比传统芯片更好的能耗效率，算力能耗比值提高了 30 倍至 80 倍。

每个周期的操作次数

CPU	10
GPU	10,000
TPU	100,000

TPU 环境配置

免费 TPU：Google Colab

最方便使用 TPU 的方法，就是使用 Google 的 Colab ，不但通过浏览器访问直接可以用，而且还免费。

在 Google Colab 的 Notebook 界面中，打开界面中

最低0.47元/天解锁文章

_APTX4869

关注

3
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
【Tensorflow教程笔记】使用 TPU 训练 TensorFlow 模型

Tensorflow教程笔记基础TensorFlow 基础TensorFlow 模型建立与训练基础示例：多层感知机（MLP）卷积神经网络（CNN）循环神经网络（RNN）深度强化学习（DRL）Keras Pipeline自定义层、损失函数和评估指标常用模块 tf.train.Checkpoint ：变量的保存与恢复常用模块 TensorBoard：训练过程可视化常用模块 tf.data ：数据集的构建与预处理常用模块 TFRecord ：TensorFlow 数据集存储格式常用
复制链接

扫一扫