AI学习手册

AI的定义:
Al,英文全称叫做Artificial lntelligence,直译过来就是人工智能。
AI的核心定义,就是由人制造出来的智能。它让机器能够模仿、学习并执行类似人类智能的任务。这种智能表现在多个方面,比如学习、推理、解决问题、知觉、语言理解等。
简单地说,Al就是让机器能够像人一样思考和行动。

Al的发展历史:
人工智能的概念可以追溯到古希腊时期,但作为一个科学领域,它是在20世纪中叶才真正开始发展。下面是Al发展的几个重要阶段:

1950年代:Al作为一个学术概念在这个时期诞生了。1956年,约翰·麦卡锡(JohnMcCarthy)等人在达特茅斯会议(Dartmouth Conference)上首次提出了“人工智能"这一术语。

1980年代:专家系统的出现,标志着Al的第一个商业成功。这些系统能模仿人类专家的决策过程,被用于医疗诊断和矿物探测等领域。

1990年代:随着互联网的兴起,大量数据的可用性增加了,机器学习开始成为AI研究的主流。

21世纪:深度学习的出现和计算能力的提升推动了Al的快速发展,出现了如AlphaGo、自动驾驶汽车等划时代的应用。

AI的分类:
人工智能可以大致分为两类:窄人工智能(Narrow Al)和通用人工智能(General Al)。
窄人工智能:也称为弱人工智能,是目前最常见的Al类型。这类Al在特定领域或任务中表现出人类般的智能。比如,语音识别软件只擅长处理语音,而不懂其他任务。这些系统通常基于大量数据的学习和模式识别。
通用人工智能:也称为强人工智能,是一种理论上的Al,它可以像人类一样执行任何智能任务。目前这类Al还未成为现实,但它是许多科幻作品中常见的主题。

在Al的发展过程中,还产生了一些子领域,如机器学习、深度学习、自然语言处理等。

机器学习是AI的一个分支,它让机器能够从数据中学习,而不是完全依靠预设的规则。
深度学习则是机器学习的子集,通过模拟人脑的神经网络结构来学习数据。
自然语言处理(NLP)是Al在语言理解和生成方面的应用。
AIGC:
最近非常流行一个概念,叫做AIGC。
AIGC的全称是Al Generated Content,可以直译为“人工智能生成内容”。直白地讲,AIGC就是指利用人工智能技术自动生成各种类型的内容,包括文本、图像、音乐、视频等等。

AIGC应用领域:
1.文本生成


某些AIGC应用可以生成连贯、自然的文本内容。其中,谷歌的Bard,百度的文心一言,阿里的通义千问,科大讯飞的讯飞星火,以及我们专栏要重点介绍的ChatGPT,都属于这一类应用。

2.图像生成

某些AlGC应用能够生成逼真的图像,这也就是人们常说的Al绘画。国内外有许多优秀的AI绘画平台。

3.视频生成


AIGC可以合成和编辑视频,生成具有特定场景、角色和动作的视频片段。几年前日本流行的虚拟偶像初音未来,就是AlGC在视频领域的早期尝试。
除了上述这些应用领域,AIGC还可以应用到音频合成、数据可视化、自动编程等领域。

ChatGPT是什么:
按照官方定义,ChatGPT是一款由OpenAl开发的先进人工智能助手,基于强大的GPT架构,旨在为用户提供丰富、高质量的语言理解和生成服务。

GPT架构:
GPT是一种自然语言处理模型。所谓自然语言处理模型,可以实现人与计算机之间通过自然语言进行有效通信。也就是说,你想和计算机沟通并不需要编程或是专业指令,只需要直接把人类的语言输出给计算机,计算机理解了你的意思,再用人类的语言回答你。

        

GPT的全称是Generative Pre-trained Transformer,这段英文又怎么来理解呢?
Generative,意思是“生成式”,也就是说GPT具有生成新文本的能力。

Pre-trained,意思是预训练”,早在你使用ChatGPT之前,GPT模型就已经通过海量的文
本数据进行了预训练,学习掌握了语言结构、语法、语义等方面的知识,从而再处理你的
提问时,拥有了强大的迁移学习能力,也就是举一反三的能力。

Transformer,字面意思是“转换器”,在这里指的是一种专门的深度学习架构,叫做
Transformer架构。
Transformer架构是一种专为自然语言处理任务设计的深度学习架构,该架构的影响力非
常大,不但GPT系列以它作为底层架构,谷歌的同类产品BERT也是以Transformer架构作
为基础。
对了,像GPT和BERT这样的模型,也被归类为大语言模型(Large Language Model),
简称LLM。

好吧,这套娃实在有点深,估计大家都有点听晕了,让我们梳理一遍:
ChatGPT是一款人工智能助手产品,它基于GPT架构开发,而GPT架构是一种自然语言处理模型,又可以被细分到大语言模型这个类别。GPT的基础则是Transformer架构,Transformer架构是专为自然语言处理任务设计的深度学习架构。
在这个信息化时代,ChatGPT具有广泛的应用价值,可以帮助用户解决各种问题,提高工作效率,拓展知识面,以及获取娱乐休闲体验。

GPT-4强大在哪里?
GPT-4相对于GPT-3.5的变革,可以说是天翻地覆的。
第一,GPT-4拥有比GTP-3.5还要多得多的模型参数,这大大提升了生成文本的质量和准确。
第二,GPT-4的模型架构从自然语言处理模型升级成了多模态模型。

什么是多模态呢?
所谓多模态(Multimodal),是指同时处理和理解多种类型数据的技术,这里的数据类型包括文本、图像、音频、视频等等。
在GPT-4当中,用户可以输入给ChatGPT的内容不再局限于文本,也包括图片、图表等等。同时,ChatGPT也可以用多种方式向用户输出内容,不光可以输出文字,也可以画图、生成语音。

第三,GPT-4支持了更长的文字输入。
GPT-3.5的最大文字输入长度是3000字,GTP-4的最大文字输入长度是25000字,这使得用户可以用更加充分的信息与chatGPT进行交流。
GPT-4比GPT-3.5更强大的具体的实践案例:
为了测试ChatGPT产品的智能程度,OpenAl曾经让ChatGPT参与了美国的各种主流考试
都有哪些考试呢?,包括号称"美国高考"的SAT考试、美国各大洲的统一司法考试UBE、国生物奥林匹克竞赛等等。
GPT-3.5与GPT-4都参与了这些考试,它们的成绩是怎样的呢?
SAT的数学部分(满分800分)
GPT-3.5考了590分,GPT-4考了700分。
美国司法考试
GPT-3.5成绩排名倒数10%,GPT-4排名前10%。
美国生物奥林匹克竞赛
GPT3.5成绩排名前69%,GPT-4排名前1%!
GPT-4与GPT-3.5,简直就是学霸与学渣的差距!
倒不是说GPT-3.5很弱,只是那个版本还没有很适合完成人类的考试,而GPT-4在智能上的提升,实在是太过显著了。
或许有人会问:GPT-4已经这么厉害了,那OpenAl还会推出GPT-5、GPT-6吗?
按照GPT系列以往的更新频率,我们或许会在2024年看到GPT-5的问世。那时的GPT-5,很可能会实现真正的通用人工智能!

 ChatGPT的应用场景
ChatGPT能用来做什么事情?那简直不要太多了,我们这里只举出8个有代表性的例子:

第一,ChatGPT可以用于文案创作。
通过用户输入的创作要求,ChatGPT可以创作出相应的文案内容。比如媒体作者可以给ChatGPT提出要求,让ChatGPT根据某一主题生成的媒体文案。广告策划人员可以把要推广的商品信息输入给ChatGPT,让ChatGPT针对此商品生成一段广告文案。
不仅如此,ChatGPT能生成的文案是多样的,不只包括商业文案,还包括优美的诗句、有趣的小说、或者电影剧本、歌词等等;甚至可以用来写各种应用文,比如请假条,申请书,日报周报,个人简历。

第二,ChatGPT可以用于语言翻译。
我们可以把想要翻译的原文输入给ChatGPT,让ChatGPT把原文翻译成我们想要的任意一种语言。这样的能力,绝对超越了世界上最厉害的翻译专家!

第三,ChatGPT可以用于金融分析。
做金融投资的人士,可以利用ChatGPT来分析市场动态、投资策略以及金融风险。从而做出最佳的决策。

第四,ChatGPT可以用于知识搜索。
以前,人们想搜索某些知识,往往是通过谷歌、百度这样的搜索引擎。但搜索引擎得到的结果往往比较散乱,而且还充斥着大量的广告,无法确保内容的正确性。大家看看几年前的魏则西事件,就能想象到搜索引擎的结果有多么不靠谱了。
如果把问题交给ChatGPT,返回的结果工整又清晰,可以使人们获取知识更高效。
而现在使用ChatGPT去回答技术问题,答案非常精准!

第五,ChatGPT可以作为聊天工具。
ChatGPT不但可能生成严肃的文本内容,也可以进行随意的聊天,甚至是进行深度的情感交流。许多在大城市独居的人们,可以通过与ChatGPT聊天,缓解情感上的空虚。

第六,ChatGPT可以用于专业咨询。
ChatGPT通过强大的学习和微调能力,可以成为任何一个细分领域的专家。
比如,我们把大量的法律知识数据投喂给ChatGPT,可以把ChatGPT训练成一个专业的法律顾问;把大量的医学知识数据投喂给ChatGPT,可以把ChatGPT变成一个医疗咨询专家
ChatGPT通过强大的学习和微调能力,可以成为任何一个细分领域的专家。

第七,ChatGPT可以用于辅助编程。
ChatGPT可以帮助程序员生成各种程序代码,从而快速搭建起一套基础代码模板,大大提升编程效率。这对于广大程序员来说,是一大利好。

第八,ChatGPT可以用于辅助Al绘画。
只有Al才更懂Al。ChatGPT可以跟Al绘画平台(比如MidJourney))配合使用,从而得到更加精准的描述词,画出用户想要的画作。
不只是Al绘画平台,其他一些AIGC产品也可以与ChatGPT配合使用,发挥更大的价值。

ChatGPT的界面:

当使用plus账号访问ChatGPT时,可以选择两种模型,一种是GPT-3.5模式,一种是GPT-4模式:
 

要想体验ChatGPT最强大功能,我们这里肯定是优先选择GPT-4模式。
如果大家是免费账号,则没有这个选项。
平台中下方的输入框,就是供我们提出问题的地方。我们可以先和ChatGPT打声招呼:
 

我们再来随意提出一个问题:

 接下来,我们尝试让chatGPT写一段代码:

由此看出,ChatGPT的智能水平还真是不简单。
接下来我们不妨刁难一下ChatGPT,让它写一篇2022年全国统一卷的高考作文。
 

大家有没有发现,ChatGPT回答到中间,忽然停住了?
这是因为ChatGPT单次回答的文本长度有限,我们在对话框输入“继续"就可以了:
 怎么样,ChatGPT的内容生成能力是不是很强大?
好了,关于如何隔使用ChatGPT提出第一个问题,我们就介绍到这里。
可能有的小伙伴会问:我还没有ChatGPT账号,该怎么办呢?
别担心,在下一讲,我会为大家介绍一个ChatGPT的替代平台。

如何更好地提问?
在初步使用ChatGPT或者替代平台的时候,大家有没有遇到过—些问题?
比如,很多时候我们问了一些问题,但ChatGPT回答给我们的,却并不是我们想要的。
这不是因为ChatGPT不够智能,而是因为提问者并没有掌握好“提问的艺术"。
提问还需要艺术吗?当然了。今天我们就来给大家讲一讲Prompt Engineering,也就是提示词工程。

提示词工程(Prompt Engineering) 
提示词,是指用户向Al模型提供的输入文本,用以引导Al模型生成特定类型的文本输出。这些输入可以是问题、任务描述或场景描述。
向AI询问问题或者提出要求,就像是对人提问一样,提问者首先要把问题说得清楚明白。如果不能描述清楚你的问题,再厉害的专家也无法给出你想要的回答。
下面两个例子,就是提示词的错误示例:

写一首什么风格的诗?题材是什么?有什么格式要求?在问题里并没有表述清楚。


你和女朋友的情况分别是什么样?是什么原因促使你想要分手?在问题里也同样没有表达。
因此,我们需要一系列向AI提问题的技巧和方法,让Al模型输出更加准确的答案。这套技巧和方法就是提示词工程。
提示词工程在ChatGPT中扮演着至关重要的角色,它能将用户的需求转化为GPT模型能理解和回应的形式。通过设计合适的提示词,能够引导GPT模型生成有针对性且高质量的回复。因此,熟练运用提示词技巧能够最大限度地发挥ChatGPT的潜力,满足各种应用场景的需求。
我们怎样入门提示词工程呢?
学习提示词工程的第一步,是要了解提示词的常用种类,目前常用的提示词主要有六大类:
1.信息检索类Prompt
向ChatGPT询问某些固有的知识,比如这样输入:“乔治.华盛顿是哪一年出生的?”

 2.文本生成类Prompt
让chatGPT根据特定要求来生成文本,比如这样输入:"我今天发烧40度,无法去上班,请向我的领导写一封请假信,要求字数在300字以内"

 3.机器翻译类Prompt
给定某一种语言的内容,让ChatGPT翻译成另一种语言,比如这样输入:“请将'the
secret of a happy old age is nothing else but a decent agreement with loneliness. '从英语翻译成中文。"        

 4.创意写作类Prompt
提出具有开放性的要求,让ChatGPT进行创作,比如这样输入:“写一个以美国南北战争为历史背景的短篇爱情小说,要求字数2000字以内。"

 (小说内容比较长,这里就省略了)
5.文本摘要类Prompt
指定一篇文章,让ChatGPT提炼出文章的核心要点,比如这样输入:"请为上面的输出总结出一个50字的摘要"

6.咨询建议类Prompt
列举现实情况,请ChatGPT提出咨询建议,比如这样输入:“我是一个21岁的北京女大学生,我喜欢上了同班爱打篮球的男同学,我应该怎样向他表白?”


以上仅仅是提示词的常见类型。要想提出好的问题,首先要明确你的提示词种类,以此才能对症下药。
一个高质量的提示词,需要做到目标明确,有前提条件,并且限定回答格式。
想要满足这些要求,你的Prompt需要包含四大组成部分,分别是任务、上下文、指令、角色。
1.任务(Task)
所谓任务,就是用户希望模型完成的具体工作,如回答问题、提供建议等。
2.上下文(Context)
有助于模型理解任务的背景信息,如相关领域知识、具体场景等。
3.指令(Instruction)
引导模型以特定方式完成任务的具体要求,如答案格式、回答深度等。
4.角色(Role)
设定模型在互动过程中扮演的身份,如专家、助手等。

对于这四个组成部分,我们来举一个应用的例子。输入内容:
"作为一个项目组的负责人,当你遇到项目组成员因工资待遇问题发生冲突时,请给出有效的解决方法。解决方法列举5条以上,总字数在200-300字之间。"
在这个例子中:
任务部分是“给出有效的解决方法"
上下文部分是“当你遇到项目组成员因工资待遇问题发生冲突时”
指令部分是“解决方法列举5条以上,总字数在200-300字之间。”
角色:项目组的负责人
这样的提示词就是一个清晰完整的提示词,ChatGPT大概率可以给出你准确而又有价值的回答。
针对这个问题,ChatGPT的回答如下:

当然,也并非每一个问题都一定要严格包含着四大要素,只有在希望ChatGPT生成较为复杂和专业的内容时,才需要兼备这些要素。
以上是实现优质提示词的基本要求。此外针对一些特殊场景,我们也需要用到几种提示词的高级技巧。

提示词的高级技巧
Prompt Engineering有哪些高级技巧呢?

1.拆解问题
对于一个一次性很难完整回答的大问题,我们可以将其拆解成若干子问题,再将这些问题逐步输入。
我们来看下面的例子:

 2.迭代改进
在进行长篇内容的创作时,很难一次就生成令人满意的内容。我们需要在与ChatGPT互动过程中,通过多轮对话和反馈不断优化生成结果,帮助用户获得更满意的输出。
我们来看下面的例子:

 
————————————————

                            版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
                        
原文链接:https://blog.csdn.net/shz101876/article/details/136341460

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值