大模型太笨？可能是你没有掌握窍门！

程序员二飞

于 2024-08-03 17:38:36 发布

阅读量761

点赞数 28

文章标签：人工智能语言模型自然语言处理 prompt 学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiangxueerfei/article/details/140894095

版权

在ChatGPT推出之后，大语言模型大火，但在用了一段时间后，我便将它弃用了，原因是…我觉得它太笨了！今天在课上抽时间听了李弘毅教授的课程，大受启发，原来不是它太笨，是我不会激发出它的潜力来，现在顺便将上课笔记整理作为分享。

a）神奇咒语法

1. chain of thought

eg : let’s think step by step let’s think about this logically

2.让模型解释一下自己的答案

eg：让模型解释一下为什么这样批改，这么做它的正确率会更高。

3.情绪勒索

eg：这件事情对我真的很重要对我的职业很重要。

4.其他咒语的论文

对模型有礼貌是没有用的，要求直说无妨 /要说要做什么，而不要说不要做什么。 /如果你做的好的话就会给你消费能有作用 / 如果你做不好你会受到处罚/ 你要保证你的答案是没有偏见的。…

5.用AI寻找神奇咒语

以增强式学习训练另外一个语言模型，即训练出一个擅长下咒语的语言模型。

b)提供给大模型更多资讯

1.把前提讲清楚

eg：ntu有台湾大学和南洋理工大学，你可以告诉他你是新加坡or台湾人

2.把AI不清楚的资料提供给他

eg：把pdf材料喂给他，然后让他画表就行

3.提供范例

eg：如果ai不知道是什么，或者怎么做，给他做示范。 in-context learning

————Gemini的in-context learning能力很强可以用来尝试

c) 拆解任务

自行把任务拆解成几个步骤，让其逐个击破

对旧模型可能有用，但是新模型不一定起作用。因为新模型自动就执行这个过程了。

eg：生成一份AI的报告拆解———— 1.先写出大纲 2.根据大纲写摘要，写段落

这一部分内容可以解释chain of thought。让他自己完成拆解任务的过程

d)让语言模型检查自己的错误

得出答案很难，但是检查出错误很简单的情况有很多。

eg：把问答丢给同一个AI机器人来尝试让他反省答案，再将问答和反省丢给AI让他重新回答。

但这个反省不会真正影响语言模型，参数没有改变，问同样的问题会有同样的答案。

e) 让大语言模型多次回答同一个问题，将最多出现的答案作为正确答案。

学名：self-consistency

问：为何同一个问题每次答案会有所不同？

答：文字接龙输出的不是字，而是一个概率分布，会输出每一个字接龙在这之后的概率。每次都会掷筛子，所以答案可能会不同。

f) 打组合拳 Tree of thoughts

拆解任务为几个步骤，并且让他做三次文字接龙产生三次答案，然后让他自我反省检查这些答案是否是正确的。

每一步骤都同时产出多个答案进行校验，最后得出正确的答案来。

g）使用工具来强化他的能力

模型不擅长做算数学，但是它可以调用工具来提升数学能力。

工具列表：

1.搜索引擎：专业问题语言模型不一定回答正确。我们先去网络或资讯库搜索，将额外资讯和困难的问题喂给AI，他将会更有可能接出正确答案。在整个过程中，语言模型没有发生任何改变。

Retrieval augmented generation

当然，是否使用搜索引擎，AI会自行决定。你也可以和他讲人话，让他上网搜索之后再进行回答。

2.写程序：

鸡兔同笼的问题，chatgpt4会选择写python解方程来结局问题。它写完程序后自动跑程序来解题。

program of thought方法。

eg：叫chat gpt写100遍哈哈哈。

3.文生图AI

DALL-E，把文生图的能力接入chatgpt。最好强调文字上不要出现文字，因为AI生成文字的能力并不是很好。

玩法测试：文字游戏

现在可以多加一句，让他根据我的描述生成一张图。

GPT Plug-in 其他的内置工具

这部分内容可以查看到Openai的ChatGPT官方所提供的插件页面。

5.语言模型如何使用工具？

使用工具的方式也是文字接龙。

eg：

这两个方块区域就是调用工具的地方。

h）模型合作

1.再训练一个模型，让他决定谁更合适

让合适的模型做合适的事情。再训练一个模型判断新的任务应该交给谁处理。

不同模型的能力和成本是不同的，简单的任务可以不让4来回答。

FrugalGPT 用一个模型来分配工作，让模型合作实现更好的效果和低廉的成本。

2.让模型彼此讨论。

把输入和输出的结果喂给模型，然后让其他模型和它进行讨论最后得出答案

注意，括号里的那句话很重要，一定要告诉他不需要完全同意我的看法，不然他会夸耀吹嘘我的翻译。

反复把他们的回复喂给对面，然后让他们得出两者都觉得是最好的答案。

让模型彼此讨论，比让他自己讨论的结果会更好，会有更高机会推翻自己之前的答案。

可以利用API调用模型，使得他们自动进行互相对话。

论文学名：exchange of thought

模型的彼此讨论是有不同的方式，不同任务有不同的最好的讨论的方式。

——讨论如何停下来？

引入裁判模型，未达成共识则讨论继续，如果达成共识则输出结果。

——逼迫模型加强反对回答的可能。

因为模型太容易认输退缩而承认输入的答案，所以我们要让他强化反对回答的可能。

一般而言，比较长的讨论会有比较好的结果。

3.引入不同的角色：

eg：ai project/manager/ai programmer /ai user

或者，也可以告诉他，你是一个什么什么人，没准这样ai就会强化它的能力。

Dynamic LLM Agent Network.

方法很简单：就是加入一个CEO，根据上述对话，给每个人的贡献打几分，让分数太低的人之后不要参与工作。

读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型！

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

👉AI大模型学习路线汇总👈

大模型学习路线图，整体分为7个大的阶段：（全套教程文末领取哈）

第一阶段： 从大模型系统设计入手，讲解大模型的主要方法；

第二阶段： 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段： 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段： 大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段： 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段： 以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段： 以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频，看书籍和视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。
在这里插入图片描述

👉学会后的收获：👈

• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求： 大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能， 学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力： 大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

👉获取方式：

😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

程序员二飞

关注

28
点赞
踩
20

收藏

觉得还不错? 一键收藏
打赏
0
评论
大模型太笨？可能是你没有掌握窍门！

在ChatGPT推出之后，大语言模型大火，但在用了一段时间后，我便将它弃用了，原因是…我觉得它太笨了！今天在课上抽时间听了李弘毅教授的课程，大受启发，原来不是它太笨，是我不会激发出它的潜力来，现在顺便将上课笔记整理作为分享。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

程序员二飞 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。