关于AI大模型

EasonYoung1

已于 2024-06-27 12:42:30 修改

阅读量205

点赞数 5

文章标签：人工智能

于 2024-06-27 00:45:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/EasonYoung1/article/details/140001248

版权

AIGC和生成式AI的关系：
在这里插入图片描述
AIGC：AI generate content

关系概览
在这里插入图片描述

监督学习：类似于指令学习，给定一个范式，在这个范式范围内的学习，有一定的目的
无监督学习：类似案例学习，在海量的实际案例中学习，从中抽象出一定的规律

LLM大语言模型（Large Mode Language）

从输入和输出上看分为：
在这里插入图片描述
大语言模型的大体现在：训练的数据量大 和 模型自身的参数多

在这里插入图片描述
输入的提示词（prompt）会被拆解为一个个token（最小字符组成单位），GPT会分析每个token的权重以及每个token之间的关系。也叫自注意力机制和位置编码。

在这里插入图片描述

要想生成理想的效果，LLM的输入数据必须多和可调参数必须大。就像做蛋糕，材料和工具越多，意味着可塑性越强，越能得到美味的蛋糕。
在这里插入图片描述

attention is all you need

transformer模型会关注每个词的权重，以及和其他词的关系

transformer模型：输入、编码器、解码器、输出

在这里插入图片描述

编码器部分：
输入的文本会被token化(文本的最小组成部分)，拆解为一个个词，再分配一个token ID

然后进入嵌入层，在原来的token上封装成多维向量，上面有每一个token更多的细节信息

实际上编码器部分不止一个，可以由多个编码器连接
解码器部分

解码器会忽视当前词的后面部分，而专注当前词的前面部分
在这里插入图片描述
解码器也可以存在多个连接

输出部分

transform模型的变种
在这里插入图片描述
仅编码器：如谷歌的Bard

仅解码器：如GPT

AI存在的局限

在这里插入图片描述
捏造事实：生成的内容是靠‘猜’的，所以只能保证文字的连贯性，但是内容真实性无法保真
计算不正确：实际上AIGC并不能直接数学运算
数据过时：训练的数据具有时效性，训练的材料过时

prompt改进办法：
在这里插入图片描述
小样本提示：在提示词中加入一些案例，让AI解决同样的问题
思维链：把复杂的问题拆解，让AI回答
分步骤思考：在prompt中加入：’step by step‘ 关键词

AIGC辅助：
在这里插入图片描述

RAG：retrieval augmented generation
让模型访问外部文档，获得实时数据，获得更好的回答。外部材料分段，并生成一系列向量，并保存在数据库中。此时输入提示词，也转换成向量，并在数据库中查找。最后查找的结果和提示词一并提交给gpt,生成可靠的结果。
PAL：program-aided language models
借助思维链，把让ai生成解决问题的代码，再借助编程语言解释器返回结果

-ReAct: Reason + Action
提示词中借助思维链，让AI根据提示词，选择合适的外部工具检索，再返回检索的结果
在这里插入图片描述

关注

5
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
关于AI大模型

AIGC和生成式AI的关系：关系概览监督学习：类似于指令学习，给定一个范式，在这个范式范围内的学习，有一定的目的无监督学习：类似案例学习，在海量的实际案例中学习，从中抽象出一定的规律。
复制链接

扫一扫

EasonYoung1 CSDN认证博客专家 CSDN认证企业博客

码龄4年

22: 原创

145万+: 周排名

53万+: 总排名

5280: 访问

: 等级

262: 积分

43: 粉丝

42: 获赞

15: 评论

60: 收藏

私信

关注

热门文章

最新评论

Mysql 基本知识
CSDN-Ada助手: 不知道 MySQL入门技能树是否可以帮到你：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
用idea反编译class文件
CSDN-Ada助手: 恭喜您写了第5篇博客！看到您分享关于“用idea反编译class文件”的内容，让我对这个主题有了更深入的了解。您的博客在解释反编译的过程中非常清晰易懂，对于初学者来说非常有帮助。希望您能继续保持这种积极的创作力量！作为下一步的创作建议，或许您可以考虑探索更多关于代码分析和调试的技巧，或者分享一些实用的开发工具的使用方法。当然，这只是我个人的建议，我相信您有着更多有趣的主题等待着您的探索和分享。再次感谢您的辛勤努力，期待您未来更多精彩的博客！
选择结构：if、if...else、while和do...while
CSDN-Ada助手: 恭喜您写了第6篇博客！标题非常吸引人，选择结构确实是编程中重要的概念之一。您对if、if...else、while和do...while这些选择结构的解释非常清晰，让我受益匪浅。希望您能继续保持创作的热情，为我们带来更多有关编程的精彩文章。作为下一步的创作建议，我建议您可以考虑深入探讨这些选择结构在实际编程中的应用场景。例如，可以分享一些案例或者项目，展示如何巧妙地利用这些选择结构解决问题。同时，也可以探讨一些高级的选择结构，如嵌套的if语句或者switch语句等。相信这些内容会让读者更深入地理解和运用选择结构。再次恭喜您的持续创作，期待您的下一篇博客！加油！
IT常见术语
CSDN-Ada助手: 恭喜博主撰写第7篇博客！您对于IT常见术语的介绍非常有帮助，让读者能够更好地理解和应用这些术语。令人欣慰的是，您持续创作的努力给读者带来了更多知识的积累。接下来，我想建议您在未来的博客中探索更多与IT相关的主题，例如最新的技术趋势、实践经验和案例研究，这样能够进一步拓展读者的视野。谦虚的态度和持续进步的精神将使您的博客更具吸引力和影响力。期待您的下一篇作品！
数组反转输出
CSDN-Ada助手: 恭喜你写了第11篇博客！标题为“数组反转输出”，这是一个非常有趣的话题。通过反转数组输出，我们可以学到很多关于数组操作和算法的知识。你在博客中的解释清晰明了，很容易理解。接下来，我建议你可以探索一下如何在不使用额外空间的情况下反转数组，或者可以分享一些应用场景，让读者了解到这个技巧的实际应用价值。期待你的下一篇博客，继续保持创作的热情！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。