我们或许将真正迎来一个「人工智能助理」时代。
我想,最近许多朋友的生活中,可能或多或少都被ChatGPT刷屏了。
你或许也已经看过了许多相关的文章。
它们或许从商业角度出发,告诉你ChatGPT引发了怎样的商业浪潮;或许从技术角度出发,告诉你ChatGPT的原理和技术有多厉害;又或者,直接向你推销各种各样的类似产品,告诉你这些产品多么有前途……
但这些,离我们的生活都有些遥远。
你可能看了很多文章,依然没有搞明白,ChatGPT究竟是什么,它跟我有什么关系?
因此,今天,我想简单聊聊这个话题。
如果你对ChatGPT从未听闻,那希望能告诉你一些新信息;如果你对此感兴趣但不熟悉,那希望能为你提供一点指引。
ChatGPT是什么?
ChatGPT实际上不是一个新事物。它是2022年11月推出的,刚推出的时候我就使用了,还在知乎发了一条想法吐槽了一下。
没想到,时隔两个月之后,随着微软及一票商业公司的入场,它又开始火了,火得家喻户晓。
那么,ChatGPT究竟是什么?
从原理上来讲,ChatGPT其实也不是新事物,它背后的基础,是母公司OpenAI在几年前发布的自然语言模型GPT。对人工智能有所了解的朋友一定知道,OpenAI于2018年发布了GPT-1,首次让人工智能能够让人类一样「理解文字」、写出文字。
随后几年里,OpenAI陆续推出了GPT-2、GPT-3,用更庞大的参数实现了更精细的学习。通俗来说,就是让人工智能更「像人」了。
目前GPT-3已经用在了很多场合。像国外已经有用GPT-3来写新闻的应用,至于用GPT-3写小说、生成游戏台词、生成代码,也都在探索中了。
而ChatGPT,就是在GPT-3的升级版GPT-3.5的基础上,进行一定的包装、微调、优化,所做出来的产品。过往的GPT-3只是一个底层引擎,必须接入到一个软件中才能使用。而ChatGPT,可以理解为OpenAI自己为GPT做了这么一个软件,让用户可以直接使用它。
所以它才叫ChatGPT,也就是「可以聊天的GPT」。
那么,GPT又是什么呢?它的全称是Generative Pre-trained Transformer,生成式预训练转换器。简单来说,它的原理是:先给它提供一个庞大的语料库(通常是直接从互联网上抓来的),让模型通过上千亿个参数对这些文本进行打散、标记、学习,构建起一个复杂的预测模型。
然后再依据这个预测模型,判断一个单词在这个情境下应该接哪一个单词。就这样一个一个单词串起来,形成一段话,或者一篇文章。
这种预测的模式,其实跟我们大脑的学习和加工模式是非常相似的。因此,这也是它能够更「像人」的一个重要原因。