【吴恩达】ChatGPT提示工程师 笔记【第一课 引言】

课程1视频地址

欢迎参加这个关于为开发者设计的ChatGPT提示工程课程。

我很高兴有Isa Fulford和我一起教授这个课程。她是OpenAI的技术团队成员,开发了广受欢迎的ChatGPT检索插件,她的很大一部分工作是教人们如何在产品中使用LLM或大型语言模型技术。她还为OpenAI Cookbook做出了贡献,该书教授人们如何使用提示。很高兴有你加入。

我也很高兴在这里和大家分享一些提示的最佳实践。

因此,互联网上有很多关于提示的材料,比如“每个人都必须知道的30个提示”。这些主要集中在ChatGPT的网络用户界面上,许多人使用它来执行特定的、通常是一次性的任务。但是,我认为作为开发者工具的LLMs,即使用API调用LLMs快速构建软件应用程序的能力,仍然被低估了。

事实上,我在AI Fund的团队,这是DeepLearning.ai的姐妹公司,一直在和许多初创公司合作,将这些技术应用于许多不同的应用中,看到LLM API能让开发者非常快速地构建什么,这很令人兴奋。因此,在本课程中,我们将与您分享一些您可以做的事情,以及如何做的最佳实践。

有很多材料需要涵盖。首先,你将学习一些用于软件开发的提示最佳实践,然后我们将介绍一些常见的用例,如总结、推断、转换、扩展,然后你将使用LLM构建一个聊天机器人。我们希望这能激发您构建新应用程序的想象力。

因此,在大型语言模型或LLM的发展中,大致有两种类型的LLM,我将称之为基础LLM和指令调优LLM。

所以,基础LLM经过训练,可以根据文本训练数据预测下一个词,通常在大量来自互联网和其他来源的数据上进行训练,以弄清楚下一个最可能的词是什么。例如,如果你提示我们从前有一只独角兽,它可能会完成这个,也就是预测接下来的几个词是住在一个神奇的森林里,和所有独角兽朋友在一起。

但如果你提示我们法国的首都是什么,那么根据互联网上的文章可能包含的内容,基础LLM很可能会完成这个,比如法国最大的城市是什么,法国的人口是多少等,因为互联网上的文章很可能是关于法国的问题列表。

相比之下,一个指令调优LLM,这是LLM研究和实践的很大动力所在,一个指令调优LLM经过训练,可以遵循指令。因此,如果你问它法国的首都是什么,它更有可能输出类似于法国的首都是巴黎的内容。所以,通常训练指令调优LLM的方法是,首先用大量文本数据训练一个基础LLM,然后进一步用指令和尝试遵循这些指令的输入和输出来训练它,然后通常进一步使用一种称为RLHF(来自人类反馈的强化学习)的技术进行精炼,使系统更能够提供帮助并遵循指示。

因为经过指令调优的LLM已经被训练得有益、诚实且无害,所以例如,它们不太可能输出像基础LLM那样可能出现问题的文本,如有毒的输出,许多实际使用场景已经转向了指令调优的LLM。你在互联网上找到的一些最佳实践可能更适合基础的LLM,但对于今天的大多数实际应用,我们会建议大多数人更关注指令调优的LLM,这些LLM更易于使用,而且由于OpenAI和其他LLM公司的工作,它们变得更安全,更符合要求。  因此,本课程将重点介绍指令调优LLM的最佳实践,这也是我们建议你在大多数应用中使用的。在继续之前,我只想感谢OpenAI和DeepLearning.ai的团队,他们为Isa和我将要演讲的材料做出了贡献。我非常感谢来自OpenAI的Andrew Mayne、Joe Palermo、Boris Power、Ted Sanders和Lillian Weng,他们与我们一起参与了素材的头脑风暴,审查素材,为这个短期课程制定了课程。我也感谢DeepLearning团队的Geoff Lodwig、Eddy Shyu和Tommy Nelson的工作。

因此,当你使用一个指令调优的LLM时,想象你是在给另一个人,比如一个聪明但不了解你的任务细节的人,给出指示。所以,当一个LLM不起作用时,有时是因为指示不够清楚。例如,如果你说,写一些关于艾伦·图灵的东西。除此之外,明确你希望文本重点放在他的科学工作、个人生活、历史角色或其他方面,也会有帮助。如果你能明确你希望文本的语气,是应该像职业记者写的那样,还是更像你给朋友草草写的一封便签?这对LLM生成你想要的东西有帮助。

当然,如果你想象自己让一个刚毕业的大学生为你执行这项任务,如果你甚至可以指定他们应该提前阅读什么样的文本片段,以便写这篇关于艾伦·图灵的文章,那么这会更好地为这个新鲜的大学毕业生成功执行这项任务。所以,在接下来的视频中,你会看到如何明确和具体,这是提示LLM的一个重要原则。你还会从Isa那里学到一个提示的第二个原则,那就是给LLM时间思考。所以,让我们继续下一个视频。

  • 21
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值