背景
2022年底,OpenAI发布了基于GPT 3.5的ChatGPT,它能够通过理解和学习人类的语言来进行对话,不仅可以实现日常对话、知识问答、信息检索、文学创作等能力,还可以实现生成调试代码等专业技能。由于其颠覆性的性能优势,一经发布便迅速引爆整个市场,发布5天后用户就超过百万,而之前发布的GPT3用了近两年才突破100万用户。
AIGC之火在2023年彻底被引燃,一时间从传统的语义大模型到多模态大模型“百模大战”,街头巷尾大家也都是ChatGPT、AI之类的词汇,如果感觉不说出点东西,就和这个时代脱节了。
可能在此之前,你看到了很多和ChatGPT、LLM相关的文章,但是可能还是没搞清楚ChatGPT、LLM是什么,能给你带来什么。
可能你无法相信,ChatGPT所带来的大模型革命,已经影响到工作生活的方方面面。根据OpenAI,OpenResearch和宾夕法尼亚大学发布了最新的研究论文《GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models》。研究人员称,GPT会是像蒸汽机或印刷机一样的通用技术,它有可能对经济的各个方面产生深远的影响,并且对职业市场和劳动力市场产生潜在的重大影响。他们估计ChatGPT和使用该程序构建的未来应用可能影响美国大约19% 的工作岗位和他们至少50%的工作任务。与此同时,80% 的美国劳动力至少有10%的工作任务在某种程度上将受到ChatGPT的影响。因此AI已经越来越成为必备的技能,要么加入,要么被取代。
管中窥豹
基本概念 Basic Concept
说到大模型,可能有一大堆的名词在铺天盖地,LLM、ChatGPT、GPT、AIGC等等,要是不清楚这些概念,就经常看文章云里雾里的,所以我们先做简单的介绍。放心,不会晦涩。
-
ChatGPT
还是先从ChatGPT入手,毕竟这是大家听到最多的名词。ChatGPT(Chat Generative Pre-trained Transformer),从英文单词直接翻译过来可以看到是生成式的预训练聊天程序。从本质上看,他是OpenAI(美国的一家人工智能公司)开发的一套聊天机器人的程序。他利用了自然语言处理工具,预先采集并训练来自互联网的数据,实现聊天互动和生成回答。在使用过程中,它能够像和人交流一样,根据聊天的上下文,实现内容提取,文案编写,代码生成等功能。
-
GPT
了解了ChatGPT之后,还有个很相似的名称就是GPT。前面我们说过,最早推出的ChatGPT实际是基于GPT 3.5训练而来的程序,当然现在也可以使用GPT 4.0。
GPT是OpenAI开发的生成式预训练模型,你可以将它理解为”引擎”,他是ChatGPT真正实现数据采集、文本生成的核心。
-
LLM<