大模型的浅层解释

memory396

已于 2023-11-25 11:13:56 修改

阅读量517

点赞数 5

文章标签：人工智能深度学习自然语言处理语言模型

于 2023-11-24 10:57:14 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_55920505/article/details/134593332

版权

大模型是大规模语言模型（Large Language Model）的简称，“大”主要指参数量巨大。

大模型旨在提供更强大、更准确的模型性能，以应对更复杂、更庞大的数据集或任务。

AI大模型：“预训练”+“大模型”，在大规模数据集上完成了预训练后无需或仅需要少量数据的微调，就能直接支撑各类应用。

为什么用大模型？

语言模型是用一种统计方法来预测句子或者文档中一系列单词出现的可能性的机器学习模型。早期模型简单，参数量较少，但是这些模型在捕捉词语之间的距离依赖关系和生成连贯的有意义的文本方面存在局限性，如GPT这样的大模型具有上千亿的参数，相比早期的模型大了很多。大量的参数可以让这些模型捕捉到它们所训练的数据中更复杂的模式，从而生成更准确的结果。

大模型优势：

1、上下文理解能力强

2、语言生成能力强

3、学习能力强

4、可迁移性高，一次训练就可以将模型应用到多种任务上，无需重新训练。

最近热点：

1、大模型（LLM）评估。

LLM核心模块：Transformer中的自注意力模块，可以高效处理序列，实现并行化、捕捉文本长距离依赖关系。

LLM关键特征：上下文学习；从人类反馈中强化学习。

近几年的相关研究可见一篇综述："A Survey on Evaluation of Large Language Models" https://arxiv.org/abs/2307.03109

主要描述的内容：

1）评估内容。2）评估领域。3）评估方法。

主要贡献：

1）描述：评估什么（现有任务）、在哪里评估（数据集和基准测试）、如何评估。

2）评估什么：总结各领域的现有任务，LLMs成功与失败案例的结论。

3）在哪里评估：评估指标、数据集和基准。

4）如何评估：研究当前评估方法，总结新的评估方法。

关注

5
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

memory396 CSDN认证博客专家 CSDN认证企业博客

码龄4年

3: 原创

173万+: 周排名

32万+: 总排名

1452: 访问

: 等级

39: 积分

8: 粉丝

5: 获赞

0: 评论

6: 收藏

私信

关注

热门文章

最新评论

大模型的浅层解释
CSDN-Ada助手: 恭喜作者发布了新的博客，这篇关于大模型的浅层解释非常有启发性。希望作者能够继续保持创作的热情，深入挖掘大模型的相关知识，并结合实际案例进行更深入的探讨。期待作者在下一篇博客中能够分享更多有关大模型的深层解读和应用实践，相信这会给读者带来更多的收获和启发。加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。