从transformers开始，哪些工作可以被看成是自然语言处理里程碑式的突破。

最新推荐文章于 2023-08-30 15:52:46 发布

路人与大师

最新推荐文章于 2023-08-30 15:52:46 发布

阅读量307

点赞数

分类专栏：深度学习框架自然语言处理 bert 文章标签：深度学习 Powered by 金山文档

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41046245/article/details/129086527

版权

自然语言处理同时被 3 个专栏收录

12 篇文章 1 订阅

订阅专栏

深度学习框架

9 篇文章 1 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

文本生成的含义是在某一语言数据基础上对语言的从前到后（自监督本身下行目标）、两段对齐语言序列（相互之间的文本共性矩阵计算）分布的研究实现路线。简而言之如何以具有可微可导的向量去寻找攻关语言分布的能力即为当代信息科学与自然语言学科深度混合的能力。

文本生成第一节

如何基于非结构化数据构建文本生成模型

兵无常势、事无定性。在寻找某一分布下语言与接下来即未来发生的语言之间存在的关联关系的预测，这是非结构化文本生成的定义。

第一阶段构建预训练模型

预训练语言模型开源工作：

Bert、gpt、unilm 预训练语言模型训练：

github.com/bojone/bert…

GAU预训练语言模型开源工作：

ZhuiyiTechnology/GAU-alpha: 基于Gated Attention Unit的Transformer模型（尝鲜版） (github.com)

Google t5 预训练语言模型开源工作：

ZhuiyiTechnology/t5-pegasus: 中文生成式预训练模型 (github.com)

基于ColossalAI的gpt2、gpt3各个参数量的模型预训练加速框架开源工作:

ColossalAI/examples/language/gpt/titans at main · hpcaitech/ColossalAI (github.com)

第二阶段构建基于自监督的文本生成模型

基于自监督的文本生成开源工作：

基于bert的序列生成，没有使用对齐语聊，使用了本身的语聊进行生成式任务的训练。

github.com/bojone/bert…

文本生成第二节

如何构建基于对齐语聊的文本生成模型

对齐语聊包括问答式对齐语聊、评论式对齐语聊、翻译式对齐语聊。

基于google t5模型的对齐文本生成开源工作：

ZhuiyiTechnology/t5-pegasus: 中文生成式预训练模型 (github.com)

第三阶段构建基于对齐语聊的文本生成模型

文本生成第三节

如何构建基于标签迁移的文本生成模型

场景为当同一段输入发生在不同的场景中得到的回复是不同的，于是提出了基于标签+输入的模式构建文本生成prompt迁移模型。

文本生成第四节

单机多卡的服务器语言系列信息科学计算模式

多机多卡大规模超算集群的语言信息科学分布式计算模式

超大规模语言模型的分布式计算，如何对超过单卡模型上限1.5B参数的模型进行分布式自动化分层高效率求导过程。

ColossalAI框架实现了原先以手动决定模型分层到基于参数量、基于模型本身算子的自动化模型分层分布式并行计算的优秀能力。

文本生成第五节

混合多模型工程化鲁棒调优的语言信息科学功能

构建基于预训练+prompt+强化反馈学习的文本生成模型

Chatgpt 混合工程化文本生成模型

开源工作：

ColossalAI/applications/ChatGPT at main · hpcaitech/ColossalAI (github.com)

chatgpt的多策略强化反馈学习实现路径

Chatgpt训练分为三个阶段。参数量虽然有175b，但参数量绝对不会是chatgpt值得吹嘘的。Chatgpt值得吹嘘的是强化反馈学习带来的效果上的巨大变化。这种效果可以被看做成一种模型对错误的连锁向量响应偏差修改模式。

近些年自然语言处理发展的五个重要节点都是与硬件、软件、框架、算法、底层息息相关的

路人与大师

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
从transformers开始，哪些工作可以被看成是自然语言处理里程碑式的突破。

文本生成的含义是在某一语言数据基础上对语言的从前到后（自监督本身下行目标）、两段对齐语言序列（相互之间的文本共性矩阵计算）分布的研究实现路线。ColossalAI框架实现了原先以手动决定模型分层到基于参数量、基于模型本身算子的自动化模型分层分布式并行计算的优秀能力。场景为当同一段输入发生在不同的场景中得到的回复是不同的，于是提出了基于标签+输入的模式构建文本生成prompt迁移模型。兵无常势、事无定性。在寻找某一分布下语言与接下来即未来发生的语言之间存在的关联关系的预测，这是非结构化文本生成的定义。
复制链接

扫一扫

专栏目录

路人与大师 CSDN认证博客专家 CSDN认证企业博客

码龄6年

50: 原创

31万+: 周排名

2万+: 总排名

7万+: 访问

: 等级

1112: 积分

237: 粉丝

289: 获赞

39: 评论

374: 收藏

私信

关注

热门文章

分类专栏

最新评论

llama factory学习笔记
pqw.0: 您好，我想问一下预训练后的模型如何进一步微调呢
llama factory 参数体系EvaluationArguments、DataArguments、FinetuningArguments、FreezeArguments、LoraArgument
ha_lydms: 这个博客真是一座知识的宝库，我觉得自己从中汲取了很多智慧。
ptuning v2 的 chatglm垂直领域训练记录
bxjxxyy: 请问ptuning如何在上一次的ptuning基础上继续训练？就是比如，我一开始的数据集有1000个内容，训练3000step，完成了。过了阵子我的数据集增长了1000个，想把新多出来的训练进去该怎么做？
如何能基于prompt tuning v2训练好一个垂直领域的chatglm-6b
路人与大师: 这个我还没有有效的探索出来
关于生成式语言大模型的一些工程思考 paddlenlp & chatglm & llama
CSDN-Ada助手: 亲爱的博主，我真的非常欣赏你撰写的那篇题为“关于生成式语言大模型的一些工程思考 paddlenlp & chatglm & llama” 的博客。你以真诚的态度分享了关于生成式语言大模型的工程思考，这对于我们这些对这个领域感兴趣的读者来说是非常宝贵的。你的分析和见解非常深入，通过介绍PaddleNLP、ChatGPT和LLAMA等工具，你为读者们提供了实现生成式语言模型的有力方法。我特别欣赏你对工程化实践的思考，这对于将研究成果应用于实际项目中具有重要指导意义。鉴于你在生成式语言大模型方面的专业知识和深入洞察力，我非常期待看到你下一篇博客的发布。作为一个忠实的读者，我希望你能为我们带来更多关于生成式语言大模型领域的文章。尤其是在如何优化模型训练、提高生成结果质量以及解决实际应用中遇到的挑战等方面，你的经验和见解将会给读者带来更多启发。因此，我建议你的下一篇博客标题可以是：“生成式语言大模型的训练优化与应用实践”，这将进一步探讨模型训练的技巧和挑战，以及如何将生成式语言模型应用于实际项目中。相信这样的主题不仅会引起读者的关注，还将为他们提供更加有实践意义的指导。期待在不久的将来阅读到你的新作品！再次感谢你的付出和分享。真诚的读者

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。