ChatGPT漫谈(二)

        ChatGPT“脱胎”于OpenAI在2020年发布的GPT-3,任何外行都可以使用GPT-3,在几分钟内提供示例,并获得所需的文本输出。GPT-3被认为是当时最强大的语言模型,但现在,ChatGPT模型似乎更强大。ChatGPT能进行天马行空的长对话,可以回答问题,它具备了类人的逻辑、思考与沟通的能力,并且它的沟通能力在一些领域表现得相当惊人,能与人进行堪比专家级的对话。ChatGPT和GPT-3类似人类的输出和惊人的通用性只是优秀技术的结果,而不是真正的“聪明”。它在本质上只是通过概率最大化不断生成数据而已,而不是通过逻辑推理来生成回复。

ChatGPT是如何炼成的

1.1 出色的NLP模型

        本质上,ChatGPT是一个出色的NLP新模型。说到NLP,大多数人先想到的是Alexa和Siri这样的语音助手,因为NLP的基础功能就是让机器理解人类的输入,但这只是技术的冰山一角。NLP是人工智能(AI)和机器学习(ML)的子集,专注于让计算机处理和理解人类语言。虽然语音是语言处理的一部分,但NLP最重要的进步在于它对书面文本的分析能力。它其中的Transformer模型提供了一种并行计算的方法,使得ChatGPT能够快速生成回答。

1.2 庞大的数据训练

         基于Transformer模型,ChatGPT的开发者们开展了大量的数据训练。在ChatGPT出现以前,OpenAI已经推出了GPT-1、GPT-2、GPT-3。虽然前几代声量不大,但模型都是极大的。GPT-1具有1.17亿个参数,OpenAI使用了经典的大型书籍文本数据集进行模型预训练。2019年,OpenAI公布了一个具有15亿个参数的模型:GPT-2。该模型架构与GPT-1原理相同,主要区别是GPT-2的规模更大。而GPT-3的整个神经网络更是达到了惊人的1750亿个参数。从GPT-1到GPT-2,再到GPT-3,尽管ChatGPT的相关数据并未被公开,但可以想象,ChatGPT的训练数据只会更多。

1.3 集优势之大成

         基于GPT-3模型并进行了微调的InstructGPT模型。在InstructGPT的模型训练中,加入了人类的评价和反馈数据,而不仅仅是事先准备好的数据集。也就是说,区别于GPT-3通过海量学习数据进行训练,在ChatGPT中,人类对结果的反馈成了AI学习过程中的一部分。OpenAI引入了人类监督员,专门“教”AI如何更好地回答人类提出的问题。当AI的回答符合人类评价标准时,就打高分,否则就打低分。这使得AI能够按照人类价值观优化数据和参数。

AI生成大流行

         2022年,是人工智能生成内容(AIGC)爆火“出圈”的一年,从AI生成绘画到AI生成代码,再到AI创作的文艺作品,人们惊叹于AI生成的内容,因为这已经不输于人类创作的水平。美国《科学》杂志发布的2022年度科学十大突破中,AIGC作为人工智能领域的重要突破赫然在列。Gartner将AlGC列为2022年五大影响力技术之一。

        什么是AIGC?实际上,AIGC是一个组合词:AI+GC,意思是用人工智能生产内容(AI Generated Content)。从内容创作方式来看,我们曾经听到的大多是PGC和UGC。其中,PGC是指专业内容生产者来生产内容。比如,一个研究并制作出高质量科技评测视频的网站,就可以被称为PGC。在互联网时代,PGC在向大众传播信息方面发挥了重要作用。UGC是指用户生成内容,这些内容不是由专业内容生产者制作的,而是由普通用户自行制作的。比如,在社交媒体上发布的照片、评论和视频等就属于UGC内容。在移动互联网时代,UGC成了主流的内容生产方式。其实AIGC的概念并非在2022年才出现。此前,类似于微软“小冰”等人工智能,作诗、写作、创作歌曲等产品生产就属于AIGC的领域。但直到2022年,随着一幅AI绘画的获奖,AIGC开始集中爆发。全球各大科技企业都在积极拥抱AIGC,不断推出相关的技术、平台和应用。

AIGC产业链参与者

        AIGC的产业链包括硬件提供商、技术提供商、数据提供商、平台供应商、应用开发商、应用服务商、最终用户等多个参与者。这些参与者在AIGC生态中协同合作,从而推动AIGC技术的不断发展,形成一个闭合的生态体系。
硬件提供商:提供机器学习训练与推理的算力,其中GPU与TPU为硬件核心,主要参与厂商包括英伟达(GPU)与谷歌(TPU)。
技术提供商:提供人工智能技术、引擎、算法、工具等,主要参与者有OpenAI、谷歌、Meta、IBM等。
数据提供商:提供各种格式的数据,如语音、图像、文本等,可能有各种不同的公司或组织,包括数据科学公司、数据库技术公司、数据挖掘公司等,具有代表性的数据提供商有IBM、Oracle、Infosys、Wipro、TCS等。
平台供应商:提供计算、存储、网络等基础设施,如谷歌、微软、亚马逊等;或提供人工智能平台,如OpenAI。
应用开发商:开发AIGC的应用程序,如聊天机器人、语音识别、图像识别等,具有代表性的应用开发商有华为、腾讯、字节跳动、百度、阿里巴巴等。
应用服务商:为最终用户提供AIGC的服务,如聊天机器人客服、语音识别服务、图像识别服务等。
最终用户:使用AIGC的产品和服务的个人和企业。

内容生产的全新变革

         如果说AI推荐算法是内容分发的强大引擎,那么,AIGC就是数据与内容生产的强大引擎。随着AIGC的出现与发展,创作主体的属人特性被冲击,艺术创作不再是人的专属。即便是模仿式创造,AI对艺术作品形式风格的可模仿能力的出现,都使创作者这一角色的创作不再是人的专利。AIGC还朝着效率和品质更高、成本更低的方向发展。从社交媒体到游戏、从广告到建筑、从编码到平面设计、从产品设计到法律、从营销到售后等各个需要人类知识创造的行业都可能被AIGC所影响和变革。数字经济和人工智能发展所需的海量数据也能通过AlGC技术生成、合成出来,即合成数据。

         ChatGPT也是典型的文本生成式AlGC。ChatGPT不仅能够满足与人类进行对话的基本功能,还可以驾驭各种风格的文体,且代码编辑能力、基础脑力工作处理能力等一系列常见文字输出任务的完成程度也大大超出预期。AIGC目前的技术更多的只是侧重于语意的图像化理解与生成,这与
ChatGPT基于神经网络的类人智能化逻辑有所差异。相比较而言,ChatGPT是人类真正期待的人工智能的样子,即具备类人沟通能力,并且借助于大数据的信息整合成为人类强大的助手。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值