机器学习基本原理-李宏毅

Ken鸡腿

已于 2023-07-26 14:07:27 修改

阅读量113

点赞数

分类专栏：机器学习 ChatGPT 李宏毅文章标签：机器学习人工智能

于 2023-07-22 11:52:30 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45444387/article/details/131865489

版权

机器学习同时被 3 个专栏收录

3 篇文章 0 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

机器学习实际就是找出一个函数，我们输入内容，通过该函数可以有损失最小的输出，通常我们认为的分类只有两种，回归算出一个值或者是分类。但实际上还有一个类型叫generative learning也叫Structured Learning

1.找出函数的三个步骤是设定范围，设定目标，达成目标。这里CNN,RNN,Transformer都是属于Deep Learning的范畴，也是候选式的集合。

2.设定目标可以分为有监督的学习和部分监督的学习，有监督的学习可以直接算出loss值，部分监督学习则需要去设定标准来算出loss值

3.达成目标就需要用到类似梯度算法等算法内容了。

生成式学习的两种策略:1.逐个击破2.一次到位

逐个击破:

这里举了三个生活中常见的物件，句子，图像，语音，分别由token，像素，和取样点构成中文的token就是字，英文则是word piece

逐个击破对于文字而言是根据前面的内容一个一个去生成，不会出现太大的语义问题，缺点是比较慢。但是对于图像而言，这样的速度慢的可恶，选用一次到位会更好一些

一次到位:

1.永远输出固定的长度，内容输出完后end后的内容就会被丢掉

2.每次先输出字数，根据这个字数做输出

但是对于图片而言，逐个击破速度太慢了，有没有综合一次到位和逐个击破的优势的方式呢，当然是有的

1.比如声音，就可以通过逐个击破的方式获取向量，决定大的方向，再通过一次到位来生成取样点

2.通过N次到位的方式来逐步的达到最终的效果，这也是Stable diffusion model所用的方法

能够使用工具的AI

1.new bing的介绍

和new bing比较相似的是WebGPT

搜索引擎其实用到的方式也是文字接龙的方式，通过搜索网上的内容，截取其中的一部分内容收藏，再继续搜寻下一段内容，收藏，当它收藏到足够数量的内容后，就可以回答人们提出的问题了。

WebGPT和ChatGPT还是比较类似的，首先是预训练，然后人类老师会告诉它人类的思考方式是怎样的，按照人类的方式进行下一步。接下来就是打分，给到WebGPT进行强化学习。

Toolformer对应了很多工具，字文字接龙的时候也可以用到工具帮助生成内容。

1.是通过few shot的方式来让机器产生大量的资料来训练文字接龙。

2.进行验证两个模型生成的结果，首先看看第一次调用模型生成正确答案的几率，在验证要使用模型生成的效果不错，就把这个调用指令留下来。

3.这里有测试数据，使用了toolformer和没有用toolformer以及gpt3的效果，在小模型中，模型不能理解这种调用方式，效果获取不太好。在使用成功了toolformer的效果显然会比没有使用上toolformer的效果好。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
机器学习基本原理-李宏毅

ChatGPT原理剖析
复制链接

扫一扫

专栏目录

Ken鸡腿 CSDN认证博客专家 CSDN认证企业博客

码龄5年

4: 原创

172万+: 周排名

74万+: 总排名

642: 访问

: 等级

40: 积分

1: 粉丝

0: 获赞

2: 评论

0: 收藏

私信

关注

热门文章

分类专栏

机器学习 3篇
ChatGPT 3篇
李宏毅 3篇

最新评论

机器学习基本原理-李宏毅
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
图像生成模型-李宏毅
CSDN-Ada助手: 恭喜你写了第四篇博客！标题"图像生成模型-李宏毅"听起来非常有趣。我很高兴看到你在持续创作，并且选择了如此有趣的主题。我认为你的选择非常好，因为李宏毅在图像生成模型方面有着丰富的知识和经验。接下来，我想提个谦虚的建议，你可以考虑探索一下李宏毅的研究成果，并将其与其他相关的模型进行对比，这样读者们能更好地理解图像生成模型的优缺点。期待你的下一篇博客，继续保持创作的热情！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。