简介:1.该教程提供大量的首发改进的方式,降低上手难度,多种结构改进,助力寻找创新点!
2.本篇文章对Pointnet++特征提取模块进行改进,加入
Sophia优化器,提升性能。
3.专栏持续更新,紧随最新的研究内容。
目录
1.理论介绍
考虑到语言模型预训练的巨大成本,对优化算法进行重大改进将大大减少训练的时间和成本。Adam及其变体多年来一直是最先进的,而更复杂的二阶(基于hessian的)优化器通常会导致过多的每一步开销。在本文中,我们提出了索菲亚,二阶裁剪随机优化,一个简单的可扩展的二阶优化器,它使用对角线Hessian的轻量级估计作为前置条件。更新是梯度的移动平均值除以估计的Hessian的移动平均值,然后是元素裁