论文
文章平均质量分 93
论文学习
Pistachiout
记录学习
展开
-
MegaScale:万级GPU集群中大模型训练
MegaScale是一个专为在超过10,000个GPU上训练大型语言模型(LLMs)而设计的生产系统。该系统通过算法和系统组件的协同设计,解决了大规模训练中的效率和稳定性挑战,从而实现了高效的训练。原创 2024-08-04 21:31:23 · 739 阅读 · 1 评论 -
自训练Self-Training学习总结
Self-training是最简单的半监督方法之一,其主要思想是找到一种方法,用未标记的数据集来扩充已标记的数据集。即首先用有标签数据训练一个分类器,然后用这个分类器对无标签数据进行分类,这样就会产生伪标签(pseudo label)或软标签(soft label),挑选一定标准的伪标签样本用来迭代训练分类器。使用场景:在现实生活中得到大量有标签数据需要大量时间经历,而自训练是有标签数据+无标签数据混合成的训练数据中使用的深度学习算法,可以利用自训练方法对无标记数据进行标记,实现己标记数据的扩充。原创 2023-04-13 16:25:27 · 7314 阅读 · 0 评论
分享