AI学习手册_ai 资料-CSDN博客

本文链接：https://blog.csdn.net/m0_68282957/article/details/140416400

AI的定义：
Al，英文全称叫做Artificial lntelligence，直译过来就是人工智能。
AI的核心定义，就是由人制造出来的智能。它让机器能够模仿、学习并执行类似人类智能的任务。这种智能表现在多个方面，比如学习、推理、解决问题、知觉、语言理解等。
简单地说，Al就是让机器能够像人一样思考和行动。

Al的发展历史：
人工智能的概念可以追溯到古希腊时期，但作为一个科学领域，它是在20世纪中叶才真正开始发展。下面是Al发展的几个重要阶段:

1950年代:Al作为一个学术概念在这个时期诞生了。1956年，约翰·麦卡锡(JohnMcCarthy)等人在达特茅斯会议(Dartmouth Conference)上首次提出了“人工智能"这一术语。

1980年代:专家系统的出现，标志着Al的第一个商业成功。这些系统能模仿人类专家的决策过程，被用于医疗诊断和矿物探测等领域。

1990年代:随着互联网的兴起，大量数据的可用性增加了，机器学习开始成为AI研究的主流。

21世纪:深度学习的出现和计算能力的提升推动了Al的快速发展，出现了如AlphaGo、自动驾驶汽车等划时代的应用。

AI的分类：
人工智能可以大致分为两类:窄人工智能(Narrow Al)和通用人工智能(General Al)。
窄人工智能:也称为弱人工智能，是目前最常见的Al类型。这类Al在特定领域或任务中表现出人类般的智能。比如，语音识别软件只擅长处理语音，而不懂其他任务。这些系统通常基于大量数据的学习和模式识别。
通用人工智能:也称为强人工智能，是一种理论上的Al，它可以像人类一样执行任何智能任务。目前这类Al还未成为现实，但它是许多科幻作品中常见的主题。

在Al的发展过程中，还产生了一些子领域，如机器学习、深度学习、自然语言处理等。

机器学习是AI的一个分支，它让机器能够从数据中学习，而不是完全依靠预设的规则。
深度学习则是机器学习的子集，通过模拟人脑的神经网络结构来学习数据。
自然语言处理(NLP)是Al在语言理解和生成方面的应用。
AIGC：
最近非常流行一个概念，叫做AIGC。
AIGC的全称是Al Generated Content，可以直译为“人工智能生成内容”。直白地讲，AIGC就是指利用人工智能技术自动生成各种类型的内容，包括文本、图像、音乐、视频等等。

AIGC应用领域：
1.文本生成

某些AIGC应用可以生成连贯、自然的文本内容。其中，谷歌的Bard，百度的文心一言，阿里的通义千问，科大讯飞的讯飞星火，以及我们专栏要重点介绍的ChatGPT，都属于这一类应用。

2.图像生成

某些AlGC应用能够生成逼真的图像，这也就是人们常说的Al绘画。国内外有许多优秀的AI绘画平台。

3.视频生成

AIGC可以合成和编辑视频，生成具有特定场景、角色和动作的视频片段。几年前日本流行的虚拟偶像初音未来，就是AlGC在视频领域的早期尝试。
除了上述这些应用领域，AIGC还可以应用到音频合成、数据可视化、自动编程等领域。

ChatGPT是什么：
按照官方定义，ChatGPT是一款由OpenAl开发的先进人工智能助手，基于强大的GPT架构，旨在为用户提供丰富、高质量的语言理解和生成服务。

GPT架构：
GPT是一种自然语言处理模型。所谓自然语言处理模型，可以实现人与计算机之间通过自然语言进行有效通信。也就是说，你想和计算机沟通并不需要编程或是专业指令，只需要直接把人类的语言输出给计算机，计算机理解了你的意思，再用人类的语言回答你。

GPT的全称是Generative Pre-trained Transformer，这段英文又怎么来理解呢?
Generative,意思是“生成式”，也就是说GPT具有生成新文本的能力。

Pre-trained,意思是预训练”，早在你使用ChatGPT之前，GPT模型就已经通过海量的文
本数据进行了预训练，学习掌握了语言结构、语法、语义等方面的知识，从而再处理你的
提问时，拥有了强大的迁移学习能力，也就是举一反三的能力。

Transformer,字面意思是“转换器”，在这里指的是一种专门的深度学习架构，叫做
Transformer架构。
Transformer架构是一种专为自然语言处理任务设计的深度学习架构，该架构的影响力非
常大，不但GPT系列以它作为底层架构，谷歌的同类产品BERT也是以Transformer架构作
为基础。
对了，像GPT和BERT这样的模型，也被归类为大语言模型(Large Language Model)，
简称LLM。

好吧，这套娃实在有点深，估计大家都有点听晕了，让我们梳理一遍:
ChatGPT是一款人工智能助手产品，它基于GPT架构开发，而GPT架构是一种自然语言处理模型，又可以被细分到大语言模型这个类别。GPT的基础则是Transformer架构，Transformer架构是专为自然语言处理任务设计的深度学习架构。
在这个信息化时代，ChatGPT具有广泛的应用价值，可以帮助用户解决各种问题，提高工作效率，拓展知识面，以及获取娱乐休闲体验。

GPT-4强大在哪里？
GPT-4相对于GPT-3.5的变革，可以说是天翻地覆的。
第一，GPT-4拥有比GTP-3.5还要多得多的模型参数，这大大提升了生成文本的质量和准确。
第二，GPT-4的模型架构从自然语言处理模型升级成了多模态模型。

什么是多模态呢?
所谓多模态(Multimodal)，是指同时处理和理解多种类型数据的技术，这里的数据类型包括文本、图像、音频、视频等等。
在GPT-4当中，用户可以输入给ChatGPT的内容不再局限于文本，也包括图片、图表等等。同时，ChatGPT也可以用多种方式向用户输出内容，不光可以输出文字，也可以画图、生成语音。

第三，GPT-4支持了更长的文字输入。
GPT-3.5的最大文字输入长度是3000字，GTP-4的最大文字输入长度是25000字，这使得用户可以用更加充分的信息与chatGPT进行交流。
GPT-4比GPT-3.5更强大的具体的实践案例：
为了测试ChatGPT产品的智能程度，OpenAl曾经让ChatGPT参与了美国的各种主流考试
都有哪些考试呢?，包括号称"美国高考"的SAT考试、美国各大洲的统一司法考试UBE、国生物奥林匹克竞赛等等。
GPT-3.5与GPT-4都参与了这些考试，它们的成绩是怎样的呢?
SAT的数学部分(满分800分)
GPT-3.5考了590分，GPT-4考了700分。
美国司法考试
GPT-3.5成绩排名倒数10%，GPT-4排名前10%。
美国生物奥林匹克竞赛
GPT3.5成绩排名前69%，GPT-4排名前1%!
GPT-4与GPT-3.5,简直就是学霸与学渣的差距!
倒不是说GPT-3.5很弱，只是那个版本还没有很适合完成人类的考试，而GPT-4在智能上的提升，实在是太过显著了。
或许有人会问:GPT-4已经这么厉害了，那OpenAl还会推出GPT-5、GPT-6吗?
按照GPT系列以往的更新频率，我们或许会在2024年看到GPT-5的问世。那时的GPT-5,很可能会实现真正的通用人工智能!

ChatGPT的应用场景
ChatGPT能用来做什么事情?那简直不要太多了，我们这里只举出8个有代表性的例子:

第一，ChatGPT可以用于文案创作。
通过用户输入的创作要求，ChatGPT可以创作出相应的文案内容。比如媒体作者可以给ChatGPT提出要求，让ChatGPT根据某一主题生成的媒体文案。广告策划人员可以把要推广的商品信息输入给ChatGPT，让ChatGPT针对此商品生成一段广告文案。
不仅如此,ChatGPT能生成的文案是多样的，不只包括商业文案，还包括优美的诗句、有趣的小说、或者电影剧本、歌词等等;甚至可以用来写各种应用文，比如请假条，申请书，日报周报，个人简历。

第二，ChatGPT可以用于语言翻译。
我们可以把想要翻译的原文输入给ChatGPT，让ChatGPT把原文翻译成我们想要的任意一种语言。这样的能力，绝对超越了世界上最厉害的翻译专家!

第三，ChatGPT可以用于金融分析。
做金融投资的人士，可以利用ChatGPT来分析市场动态、投资策略以及金融风险。从而做出最佳的决策。

第四，ChatGPT可以用于知识搜索。
以前，人们想搜索某些知识，往往是通过谷歌、百度这样的搜索引擎。但搜索引擎得到的结果往往比较散乱，而且还充斥着大量的广告，无法确保内容的正确性。大家看看几年前的魏则西事件，就能想象到搜索引擎的结果有多么不靠谱了。
如果把问题交给ChatGPT，返回的结果工整又清晰，可以使人们获取知识更高效。
而现在使用ChatGPT去回答技术问题，答案非常精准!

第五，ChatGPT可以作为聊天工具。
ChatGPT不但可能生成严肃的文本内容，也可以进行随意的聊天，甚至是进行深度的情感交流。许多在大城市独居的人们，可以通过与ChatGPT聊天，缓解情感上的空虚。

第六，ChatGPT可以用于专业咨询。
ChatGPT通过强大的学习和微调能力，可以成为任何一个细分领域的专家。
比如，我们把大量的法律知识数据投喂给ChatGPT，可以把ChatGPT训练成一个专业的法律顾问;把大量的医学知识数据投喂给ChatGPT，可以把ChatGPT变成一个医疗咨询专家
ChatGPT通过强大的学习和微调能力，可以成为任何一个细分领域的专家。

第七，ChatGPT可以用于辅助编程。
ChatGPT可以帮助程序员生成各种程序代码，从而快速搭建起一套基础代码模板，大大提升编程效率。这对于广大程序员来说，是一大利好。

第八，ChatGPT可以用于辅助Al绘画。
只有Al才更懂Al。ChatGPT可以跟Al绘画平台（比如MidJourney)）配合使用，从而得到更加精准的描述词，画出用户想要的画作。
不只是Al绘画平台，其他一些AIGC产品也可以与ChatGPT配合使用，发挥更大的价值。

ChatGPT的界面:

当使用plus账号访问ChatGPT时，可以选择两种模型，一种是GPT-3.5模式，一种是GPT-4模式:

要想体验ChatGPT最强大功能，我们这里肯定是优先选择GPT-4模式。
如果大家是免费账号，则没有这个选项。
平台中下方的输入框，就是供我们提出问题的地方。我们可以先和ChatGPT打声招呼:

我们再来随意提出一个问题:

接下来，我们尝试让chatGPT写一段代码:

由此看出，ChatGPT的智能水平还真是不简单。
接下来我们不妨刁难一下ChatGPT，让它写一篇2022年全国统一卷的高考作文。

大家有没有发现，ChatGPT回答到中间，忽然停住了?
这是因为ChatGPT单次回答的文本长度有限，我们在对话框输入“继续"就可以了:
怎么样，ChatGPT的内容生成能力是不是很强大?
好了，关于如何隔使用ChatGPT提出第一个问题，我们就介绍到这里。
可能有的小伙伴会问:我还没有ChatGPT账号，该怎么办呢?
别担心，在下一讲，我会为大家介绍一个ChatGPT的替代平台。

如何更好地提问?
在初步使用ChatGPT或者替代平台的时候，大家有没有遇到过—些问题?
比如，很多时候我们问了一些问题，但ChatGPT回答给我们的，却并不是我们想要的。
这不是因为ChatGPT不够智能，而是因为提问者并没有掌握好“提问的艺术"。
提问还需要艺术吗?当然了。今天我们就来给大家讲一讲Prompt Engineering，也就是提示词工程。

提示词工程(Prompt Engineering)
提示词，是指用户向Al模型提供的输入文本，用以引导Al模型生成特定类型的文本输出。这些输入可以是问题、任务描述或场景描述。
向AI询问问题或者提出要求，就像是对人提问一样，提问者首先要把问题说得清楚明白。如果不能描述清楚你的问题，再厉害的专家也无法给出你想要的回答。
下面两个例子，就是提示词的错误示例:

写一首什么风格的诗?题材是什么?有什么格式要求?在问题里并没有表述清楚。

你和女朋友的情况分别是什么样?是什么原因促使你想要分手?在问题里也同样没有表达。
因此，我们需要一系列向AI提问题的技巧和方法，让Al模型输出更加准确的答案。这套技巧和方法就是提示词工程。
提示词工程在ChatGPT中扮演着至关重要的角色，它能将用户的需求转化为GPT模型能理解和回应的形式。通过设计合适的提示词，能够引导GPT模型生成有针对性且高质量的回复。因此，熟练运用提示词技巧能够最大限度地发挥ChatGPT的潜力，满足各种应用场景的需求。
我们怎样入门提示词工程呢?
学习提示词工程的第一步，是要了解提示词的常用种类，目前常用的提示词主要有六大类:
1．信息检索类Prompt
向ChatGPT询问某些固有的知识，比如这样输入:“乔治.华盛顿是哪一年出生的?”

2.文本生成类Prompt
让chatGPT根据特定要求来生成文本，比如这样输入:"我今天发烧40度，无法去上班，请向我的领导写一封请假信，要求字数在300字以内"

3.机器翻译类Prompt
给定某一种语言的内容，让ChatGPT翻译成另一种语言，比如这样输入:“请将'the
secret of a happy old age is nothing else but a decent agreement with loneliness. '从英语翻译成中文。"

4.创意写作类Prompt
提出具有开放性的要求，让ChatGPT进行创作，比如这样输入:“写一个以美国南北战争为历史背景的短篇爱情小说，要求字数2000字以内。"

(小说内容比较长，这里就省略了)
5．文本摘要类Prompt
指定一篇文章，让ChatGPT提炼出文章的核心要点，比如这样输入:"请为上面的输出总结出一个50字的摘要"

6.咨询建议类Prompt
列举现实情况，请ChatGPT提出咨询建议，比如这样输入:“我是一个21岁的北京女大学生，我喜欢上了同班爱打篮球的男同学，我应该怎样向他表白?”

以上仅仅是提示词的常见类型。要想提出好的问题，首先要明确你的提示词种类，以此才能对症下药。
一个高质量的提示词，需要做到目标明确，有前提条件，并且限定回答格式。
想要满足这些要求，你的Prompt需要包含四大组成部分，分别是任务、上下文、指令、角色。
1．任务(Task)
所谓任务，就是用户希望模型完成的具体工作，如回答问题、提供建议等。
2.上下文(Context)
有助于模型理解任务的背景信息，如相关领域知识、具体场景等。
3.指令(Instruction)
引导模型以特定方式完成任务的具体要求，如答案格式、回答深度等。
4.角色(Role)
设定模型在互动过程中扮演的身份，如专家、助手等。

对于这四个组成部分，我们来举一个应用的例子。输入内容:
"作为一个项目组的负责人，当你遇到项目组成员因工资待遇问题发生冲突时，请给出有效的解决方法。解决方法列举5条以上，总字数在200-300字之间。"
在这个例子中:
任务部分是“给出有效的解决方法"
上下文部分是“当你遇到项目组成员因工资待遇问题发生冲突时”
指令部分是“解决方法列举5条以上，总字数在200-300字之间。”
角色:项目组的负责人
这样的提示词就是一个清晰完整的提示词，ChatGPT大概率可以给出你准确而又有价值的回答。
针对这个问题，ChatGPT的回答如下:

当然，也并非每一个问题都一定要严格包含着四大要素，只有在希望ChatGPT生成较为复杂和专业的内容时，才需要兼备这些要素。
以上是实现优质提示词的基本要求。此外针对一些特殊场景，我们也需要用到几种提示词的高级技巧。

提示词的高级技巧
Prompt Engineering有哪些高级技巧呢?

1．拆解问题
对于一个一次性很难完整回答的大问题，我们可以将其拆解成若干子问题，再将这些问题逐步输入。
我们来看下面的例子:

2.迭代改进
在进行长篇内容的创作时，很难一次就生成令人满意的内容。我们需要在与ChatGPT互动过程中，通过多轮对话和反馈不断优化生成结果，帮助用户获得更满意的输出。
我们来看下面的例子:

————————————————

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

原文链接：https://blog.csdn.net/shz101876/article/details/136341460