1-3课程视频总结

GENERATIVE AI

课程介绍:本门课程为台大李宏毅老师于2024年开设的《生成式人工智慧导论》
学习内容为:

很多同學以為這是一門教大家怎麼用 ChatGPT 的課程,其實 ChatGPT 只是大型語言模型中的一個,而大型語言模型只是生成式人工智慧的一部分。在這門課中,我們不會特別專注於特定軟體或平台的操作,而是要深入探索其背後的魔法——也就是原理。就好像,當你理解了魔術師是如何讓兔子從帽子中跳出來的原理後,你不僅能欣賞魔術的精彩,還能有機會在未來創造出自己的魔術。今天,使用 ChatGPT 等平台已經變得非常簡單,任何人都可以輕鬆上手,網路上也充斥著各式各樣的學習資源,但這門課的目標是帶你更進一步,讓你不僅只是使用工具,而是理解其背後的原理,修完這門課,當你再次使用 ChatGPT 或其他類似工具時,你將能夠更深入地理解它們的運作方式,利用它們的潛力和了解他們可能的極限。(摘自李宏毅老师课程简介)

Prompt Engineering

在这里插入图片描述
现在人工智能已经从“工具”变为了“工具人”。为了提高人工智能的表现有两个方法:1.改变人对人工智能沟通的方式但不改变模型的参数(Prompt Engineering);2.训练新的人工智能模型or改变模型的参数。
在不訓練模型的情況下強化語言模型的方法:

1.Chain of Thought(CoT)

在于人工智能“沟通”的时候,加上“神奇的咒语”(神奇咒语并不一定对所有模型都有用)。a.让人工智能给出详细步骤eg.(Step by step);b.让人工智能先解释再回答、c.“情绪勒索”eg.(This is important to my career)

可以利用Reinforcement Learning(RL)来寻找“神奇咒语”。在这里插入图片描述
另设计新的模型来生成“咒语”输入人工智能模型,利用一定标准来对人工智能模型给出的回答进行“评分”并反馈至设计的模型进行训练。

  1. 提供额外资料

在这里插入图片描述
这里模型的并没有被训练,参数没有改变。模型并没有真正学习到什么是正面的例子什么是负面的例子。

  1. 把任务分多步骤来解

在这里插入图片描述
模型分步骤拆解任务可以将任务分为多个更容易的子任务。如上图,一个数学问题,模型可以拆解为:列式子+求式子答案
在这里插入图片描述
可以让模型自己反省,有些问题求解较难,模型可能会“乱”给(接龙)一个答案出来,而证伪较为简单。例如上图中的鸡兔同笼,可以由答案很容易地进行证伪。
在这里插入图片描述
生成式模型的输入是由用户输入+某一特定分布(正态分布)的输入共同构成,所以即使每次输入相同的用户输入也会得到不一样的结果(详情见生成式模型:影片1影片2影片3影片4),可以简单地理解为:【掷骰子】。我们可以让相同输入得到次数最多的回答作为最终回答,此策略为Self-Consistency

  1. 使用工具

在这里插入图片描述
在这里插入图片描述
如上图,当让模型进行数学计算,会发现答案错误,甚至是简单的乘法运算。发现人工智能也有不擅长的事,可以借助工具让其实现画图、网页搜索、写程序等功能。
在这里插入图片描述
大语言模型的核心是Transformer,其中的解码器Decoder输出过程其实是一个“文字接龙”(是将Decoder前面的输出做新的输入进Decoder当输出为表示【End】的特殊符号的时候停止)。
LLM会自行判断什么时候要使用工具,此时会生成一个特殊符号,呼叫工具使用。

  • 8
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值