大模型太笨?可能是你没有掌握窍门!

在ChatGPT推出之后,大语言模型大火,但在用了一段时间后,我便将它弃用了,原因是…我觉得它太笨了!今天在课上抽时间听了李弘毅教授的课程,大受启发,原来不是它太笨,是我不会激发出它的潜力来,现在顺便将上课笔记整理作为分享。

a)神奇咒语法

1. chain of thought

eg : let’s think step by step let’s think about this logically

2.让模型解释一下自己的答案

eg:让模型解释一下为什么这样批改,这么做 它的正确率会更高。

3.情绪勒索

eg:这件事情对我真的很重要 对我的职业很重要。

4.其他咒语的论文

对模型有礼貌是没有用的,要求直说无妨 /要说要做什么,而不要说不要做什么。 /如果你做的好的话就会给你消费能有作用 / 如果你做不好你会受到处罚/ 你要保证你的答案是没有偏见的。…

5.用AI寻找神奇咒语

以增强式学习训练另外一个语言模型,即训练出一个擅长下咒语的语言模型。

b)提供给大模型更多资讯

1.把前提讲清楚

eg:ntu有台湾大学和南洋理工大学,你可以告诉他你是新加坡or台湾人

2.把AI不清楚的资料提供给他

eg:把pdf材料喂给他,然后让他画表就行

3.提供范例

eg:如果ai不知道是什么,或者怎么做,给他做示范。 in-context learning

————Gemini的in-context learning能力很强可以用来尝试

c) 拆解任务

自行把任务拆解成几个步骤,让其逐个击破

对旧模型可能有用,但是新模型不一定起作用。因为新模型自动就执行这个过程了。

eg:生成一份AI的报告拆解———— 1.先写出大纲 2.根据大纲写摘要,写段落

这一部分内容可以解释chain of thought。让他自己完成拆解任务的过程

d)让语言模型检查自己的错误

得出答案很难,但是检查出错误很简单的情况有很多。

eg:把问答丢给同一个AI机器人来尝试让他反省答案,再将问答和反省丢给AI让他重新回答。

但这个反省不会真正影响语言模型,参数没有改变,问同样的问题会有同样的答案。

e) 让大语言模型多次回答同一个问题,将最多出现的答案作为正确答案。

学名:self-consistency

问:为何同一个问题每次答案会有所不同?

答:文字接龙输出的不是字,而是一个概率分布,会输出每一个字接龙在这之后的概率。每次都会掷筛子,所以答案可能会不同。

f) 打组合拳 Tree of thoughts

拆解任务为几个步骤,并且让他做三次文字接龙产生三次答案,然后让他自我反省检查这些答案是否是正确的。

每一步骤都同时产出多个答案进行校验,最后得出正确的答案来。

g) 使用工具来强化他的能力

模型不擅长做算数学,但是它可以调用工具来提升数学能力。

工具列表:

1.搜索引擎:专业问题语言模型不一定回答正确。我们先去网络或资讯库搜索,将额外资讯和困难的问题喂给AI,他将会更有可能接出正确答案。 在整个过程中,语言模型没有发生任何改变。

Retrieval augmented generation

当然,是否使用搜索引擎,AI会自行决定。你也可以和他讲人话,让他上网搜索之后再进行回答。

2.写程序:

鸡兔同笼的问题,chatgpt4会选择写python解方程来结局问题。它写完程序后自动跑程序来解题。

program of thought方法。

eg:叫chat gpt写100遍哈哈哈。

3.文生图AI

DALL-E,把文生图的能力接入chatgpt。 最好强调文字上不要出现文字,因为AI生成文字的能力并不是很好。

玩法测试:文字游戏

现在可以多加一句,让他根据我的描述生成一张图。

  1. GPT Plug-in 其他的内置工具

这部分内容可以查看到Openai的ChatGPT官方所提供的插件页面。

5.语言模型如何使用工具?

使用工具的方式也是文字接龙。

eg:

这两个方块区域就是调用工具的地方。

h)模型合作

1.再训练一个模型,让他决定谁更合适

让合适的模型做合适的事情。再训练一个模型判断新的任务应该交给谁处理。

不同模型的能力和成本是不同的,简单的任务可以不让4来回答。

FrugalGPT 用一个模型来分配工作,让模型合作实现更好的效果和低廉的成本。

2.让模型彼此讨论。

把输入和输出的结果喂给模型,然后让其他模型和它进行讨论最后得出答案

注意,括号里的那句话很重要,一定要告诉他不需要完全同意我的看法,不然他会夸耀吹嘘我的翻译。

反复把他们的回复喂给对面,然后让他们得出两者都觉得是最好的答案。

让模型彼此讨论,比让他自己讨论的结果会更好,会有更高机会推翻自己之前的答案。

可以 利用API调用模型,使得他们自动进行互相对话。

论文学名:exchange of thought

模型的彼此讨论是有不同的方式,不同任务有不同的最好的讨论的方式。

——讨论如何停下来?

引入裁判模型,未达成共识则讨论继续,如果达成共识则输出结果。

——逼迫模型加强反对回答的可能。

因为模型太容易认输退缩而承认输入的答案,所以我们要让他强化反对回答的可能。

一般而言,比较长的讨论会有比较好的结果。

3.引入不同的角色:

eg:ai project/manager/ai programmer /ai user

或者,也可以告诉他,你是一个什么什么人,没准这样ai就会强化它的能力。

Dynamic LLM Agent Network.

方法很简单: 就是加入一个CEO,根据上述对话,给每个人的贡献打几分,让分数太低的人之后不要参与工作。

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

  • 28
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序员二飞

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值