TPU和其他（李沐老师课程）

最新推荐文章于 2025-05-27 14:44:45 发布

kylecrystal

最新推荐文章于 2025-05-27 14:44:45 发布

阅读量1k

点赞数 13

文章标签： fpga开发深度学习 deep learning pytorch python

本文链接：https://blog.csdn.net/2401_87085787/article/details/142212936

版权

这张图片展示的是Qualcomm Snapdragon 845移动平台的芯片组布局。具体来说：

在中心位置有一个大的矩形模块，上面写着“Snapdragon X20 LTE modem”，这指的是高通的X20 LTE调制解调器，它是用于无线通信的组件。
在其下方，有一个较小的矩形模块，标记着“Wi-Fi”，这是处理无线网络信号的组件。
在左上角，有一个名为“Hexagon 685 DSP”的模块，这是高通的数字信号处理器，用于处理音频和视频信号。
在右上角，有一个标有“Adreno 630 Visual Processing Subsystem”的模块，这是高通的图形处理单元（GPU），负责图形渲染和一些计算任务。
在左下角，有一个“Aqstic Audio Codec”，这是高通的音频编解码器，用于处理音频输入和输出。
在右下角，有一个“Spectra 280 ISP”，这是图像信号处理器，用于处理相机传感器捕获的图像数据。
在中心偏下的位置，有一个“Kryo 385 CPU”，这是高通的自研CPU核心。
在右方，有一个“System Memory”，这是手机的系统内存。
在右下角还有一个“Secure Processing Unit”，这是安全处理单元，用于处理敏感信息和加密任务。
整体布局体现了SoC（System on Chip，片上系统）的设计理念，所有这些组件都集成在一个单一的芯片上，提高了效率和节省了空间。

这张图片介绍了数字信号处理(DSP)的一些特点和优势：

数字信号处理主要应用于特定的算法，比如点积、卷积和快速傅立叶变换(FFT)等。
它的特点是低功耗和高性能，相比移动GPU，DSP在某些特定任务上能够提供更快的速度，同时消耗更少的能量。
DSP采用VLIW（Very long instruction word，超长指令字）架构，一条指令可以完成上百次乘累加运算，这使其在处理数学密集型任务时非常有效。

然而，这也带来了一定的挑战：

这张图片介绍的是可编程阵列（FPGA）的相关内容：

然而，FPGA也有一些缺点：

这张图片讨论了AI ASIC的主题：

AI ASIC是指专门为人工智能（AI）设计的应用特定制（Application-Specific Integrated Circuit）芯片，这是一个深度学习领域的热门方向。
许多大公司如Intel, Qualcomm, Google, Amazon, Facebook等都在研发自己的AI芯片。
其中Google的TPU（Tensor Processing Unit）是一个标志性产品，它可以与Nvidia GPU相媲美。
Google已经在自家服务中大量部署了TPU，例如用于加速其云计算服务中的机器学习任务。
TPU的核心是systolic array，这是一种特殊的矩阵计算架构，特别适合于张量处理，也就是深度学习中常见的多维数组操作。