打破垄断！Photon让AI大模型训练不再受制于数据中心 | AI也能从“错误“中来学习写代码了

本文链接：https://blog.csdn.net/m0_59164520/article/details/144477784

大模型领域的发展日新月异，每天都有许多有趣的论文值得深入品读。下面是本期觉得比较有意思的论文：

1、打破垄断！Photon让AI大模型训练不再受制于数据中心

2、AI也能从"错误"中学习写代码了

1、打破垄断！Photon让AI大模型训练不再受制于数据中心

在当前AI领域，训练大语言模型(LLM)几乎是科技巨头的专利，因为这需要庞大的数据中心和高带宽通信。但最近，研究人员开发的Photon系统可能会改变这一现状，它首次实现了在低带宽环境下的联邦训练方案，让分散在世界各地的GPU也能协同训练大模型。

Photon的核心创新在于它独特的联邦学习策略：它允许每个参与节点先进行本地训练，然后才进行模型同步。这种方式不仅将通信开销降低了64到512倍，而且训练速度反而比传统方法快了35%。更令人惊喜的是，使用Photon训练的7B参数模型，其性能甚至超过了在数据中心集中训练的模型。

在实践中，Photon采用了一个大胆的训练策略：使用小批量的数据配合极高的学习率。这种看似冒险的组合在联邦学习框架下却异常稳定，使得模型收敛速度比此前的方法快了一倍。目前，Photon已经成功支持了1811个实验，并促成了6篇研究论文的发表。

这项突破性的工作为AI民主化开辟了新的可能：它让分布在全球各地的研究者和开发者也能参与到大模型的训练中来，不再受制于大型数据中心。这意味着未来的AI发展可能会更加开放和多元化，让更多创新者有机会参与其中。

论文标题：Photon: Federated LLM Pre-Training

论文链接：https://arxiv.org/abs/2411.02908

2、AI也能从"错误"中学习写代码了

在编程学习中，从错误中吸取教训是提高水平的关键。但对于AI来说，这个看似简单的学习过程却是一个巨大的挑战。最近，研究人员提出了一种新方法RLEF（基于执行反馈的强化学习），让AI终于也能像人类程序员一样，通过运行结果的反馈来不断改进代码。

RLEF的工作方式非常巧妙：它让AI像参加编程竞赛一样反复尝试解决同一个问题。每次AI写出代码后，系统都会立即执行这段代码并返回测试结果。如果代码有错误，AI会根据错误信息和测试结果进行修改；如果测试通过，就完成任务。这个过程就像有一位经验丰富的导师在旁边指导，让AI能够从每次尝试中学习。

实验结果令人振奋：在竞争性编程任务上，采用RLEF训练的AI模型（不论是8B还是70B参数规模）都创造了新的记录。更令人惊喜的是，它生成正确代码所需的尝试次数比传统方法减少了90%。换句话说，AI不仅写出了更好的代码，而且效率也大大提高。

这项突破为AI辅助编程带来了新的可能。传统的AI编程助手往往需要多次重新生成代码才能得到正确结果，而经过RLEF训练的模型则能像经验丰富的程序员一样，从错误中学习并快速改进。这不仅让AI编程更加高效，也让其行为方式更接近人类程序员的学习过程。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述