Notebook——A New Golden Age in Computer Architecture: Empowering the MachineLearning Revolution

最新推荐文章于 2022-06-14 08:56:20 发布

淡定路过的我

最新推荐文章于 2022-06-14 08:56:20 发布

阅读量369

点赞数

分类专栏：体系结构

本文链接：https://blog.csdn.net/qq_40891899/article/details/106766537

版权

体系结构专栏收录该内容

28 篇文章 12 订阅

订阅专栏

当今ML发展 = 可用的数据集 + 分析数据的计算资源

一、影响ML硬件设计的六个因素

1、Training

training（训练）和inference（推理）同样重要，但是training需要的运算操作以及硬件资源远超inference。所以ML硬件设计通常选择更简单，更容易扩展的推理部分入手

2、Batch Size

Batch Siz（批处理大小）对体系结构具有根本性意义，是操作数重用的实现形式。某些情况批处理大小会限制ML性能，这时增加Batch Size即可；有时候训练速率小于批处理大小，意味着Batch Size不是瓶颈，需要寻找其他算法或者体系结构方法来加速。

3、Sparsity and Embeddings

Sparsity：细粒度和粗粒度。本文认为粗粒度（coarse-grain）具有更大潜力： Mixture of Experts (MoE) models，使用更少的触发器训练更多的权重获得更高的准确性。
Embeddings：嵌入能将大型的稀疏空间转化为更紧凑的，适合线性运算的紧密空间。（常用于Web搜索、文本翻译等，在大型数据结构中访问相对较小的数据）

4、Quantization and Distillation

inference所用到的技术可能在training方面也很有效，比如：Quantized（量化）和 Reduced-Precision Arithmetic （精简计算）。但是在精简计算和小规模模型只有少量工作。通常使用大规模模型引导小规模模型训练来获得更高准确度，但是我们能直接训练小规模模型来获得更高准确度吗？在较大模型训练是否一定能得到更高准确度呢？