关于ChatGPT（一）

最新推荐文章于 2024-07-27 12:20:46 发布

符小东

最新推荐文章于 2024-07-27 12:20:46 发布

阅读量108

点赞数 1

文章标签： python nlp ai bert 深度学习 Powered by 金山文档

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_60500450/article/details/129050065

版权

之前学习+工作的AI/NLP，主要就Bert实现了大一统。再就是传统的机器学习算法也有老市场+快速等优势。FB家的FastText也好用。基本就文字→词向量→微调。考虑优化的标签平滑和知识蒸馏。

目前看LLM所能达到的成就是划时代的。学习分析下来，感觉AlphaGo具有指引作用。下围棋的结果是有输赢的，然后加强学习，AlhpaGo之类的可以快速达到相当高的成就。而到NLP领域，还是需要人工标注数据。

深度神经网络到transformer的自注意力机制，之后就是encoder端(结合上下文)和decoder端(mask掩盖下文)的不同方向。Bert就是预训练词向量，GPT就generate生成式内容。

单看OpenAI这边。GPT2.0《Language Models are Unsupervised Multitask Learners》和GPT3.0《Language Models are Few-Shot Learners》（GPT-3只训练了1轮，有1750亿参数），再就是InstructGPT，《Training Language Models to follow Instructions with Human Feedback》，13亿参数。再有文字→绘画领域，还有主代码领域的Codex，有一种说法：ChatGPT的推理能力来自代码训练。

高质量+大量的语料是大语言模型学习的内容。RLHF(Reinforcement Learning from Human Feedback)实现数据与模型训练的飞轮。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
关于ChatGPT（一）

再有文字→绘画领域，还有主代码领域的Codex，有一种说法：ChatGPT的推理能力来自代码训练。目前看LLM所能达到的成就是划时代的。下围棋的结果是有输赢的，然后加强学习，AlhpaGo之类的可以快速达到相当高的成就。深度神经网络到transformer的自注意力机制，之后就是encoder端(结合上下文)和decoder端(mask掩盖下文)的不同方向。之前学习+工作的AI/NLP，主要就Bert实现了大一统。再就是传统的机器学习算法也有老市场+快速等优势。高质量+大量的语料是大语言模型学习的内容。
复制链接

扫一扫

符小东 CSDN认证博客专家 CSDN认证企业博客

码龄3年

19: 原创

20万+: 周排名

19万+: 总排名

2万+: 访问

: 等级

291: 积分

12: 粉丝

26: 获赞

13: 评论

47: 收藏

私信

关注

热门文章

最新评论

秦-奋六世之余烈(大秦帝国系列)、红楼梦等
符小东: 元：粗糙记录点：成吉思汗传位老三、大军给老四拖雷。老四阻碍了，然后回军途中暴毙。到第三代就分崩离析了，拔都蒙哥等。宋：宋辽澶渊之盟，止戈100年（寇准范仲淹王安石司马光苏轼）然后金国崛起。
23年暑期收尾--＞开启读研+工作(一)
符小东: 我只会粗略的看（细致的量化能力太差）： ①现在是美加息高位5%，算非常高吧。这太影响资金面和资产价格了。 ②房住不炒。真心太多人买房是炒作赚差价的。以前自己家的房价能涨N百万，心态/大额消费都杠杠的。“炒”的预期打掉，房价总体走稳，那么会影响太多。 ③除了高科技/卡脖子等重大投资，我感觉政府的主要投入方向在年收入极低的6亿人。（真爱国真打仗只能靠广大老百姓。大家都爱子女，打仗真快来的时候，有门路的大多不会让孩子去前线）
macOS macbook M1安装ROS，使用docker虚拟的ubuntu
起风了啦: 我也感觉不好弄，尤其是低版本的Ubuntu配Ros，还好还有一个Windows可以用
macOS macbook M1安装ROS，使用docker虚拟的ubuntu
符小东: 没，明年再整这些…(感觉，ROS不好上m1，走主流硬件)

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

符小东 你的鼓励将是我创作的最大动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。