一文带你了解爆火的Chat GPT

最新推荐文章于 2024-09-22 14:21:09 发布

python_One1

最新推荐文章于 2024-09-22 14:21:09 发布

阅读量373

点赞数 1

文章标签： gpt 人工智能 chatgpt 机器学习深度学习

本文链接：https://blog.csdn.net/python_One1/article/details/130740726

版权

本文详细介绍了OpenAI的ChatGPT，一个基于GPT-3.5的对话式语言模型，通过强化学习微调，能流畅地与用户交互。ChatGPT因其高质量的对话体验在全球范围内迅速走红，引发热议。文章探讨了ChatGPT的技术背景，包括语言模型和强化学习的发展，并分析了其背后的强化学习技术细节，如监督信号和人类反馈强化学习。此外，还讨论了ChatGPT的未来应用前景和技术创新，以及资本市场对其的看法。

摘要由CSDN通过智能技术生成

导读

OpenAI近期发布聊天机器人模型ChatGPT，迅速出圈全网。它以对话方式进行交互。以更贴近人的对话方式与使用者互动，可以回答问题、承认错误、挑战不正确的前提、拒绝不适当的请求。高质量的回答、上瘾式的交互体验，圈内外都纷纷惊呼。

为什么有如此高的评价？理论支撑是什么？背后的技术原理是什么？待解决的问题和方案有哪些？资本怎么看待这件事？本文的目标是将这些问题详细的给大家讲清楚。

1 ChatGPT是什么？

ChatGPT本质是一个应用在对话场景的语言模型，基于GPT3.5通过人类反馈的强化学习微调而来，能够回答后续问题、承认错误、质疑不正确的前提以及拒绝不适当的请求。首先让我们今天的主角ChatGPT来亲自介绍自己。

1.1 让ChatGPT介绍自己

ChatGPT是什么？既然ChatGPT是语言模型，语言模型是什么？通过强化学习训练，强化学习又是什么？
在这里插入图片描述

1.2 全球范围的兴起和爆发

OpenAI 11月30号发布，首先在北美、欧洲等已经引发了热烈的讨论。随后在国内开始火起来。全球用户争相晒出自己极具创意的与ChatGPT交流的成果。ChatGPT在大量网友的疯狂测试中表现出各种惊人的能力，如流畅对答、写代码、写剧本、纠错等，甚至让记者编辑、程序员等从业者都感受到了威胁，更不乏其将取代谷歌搜索引擎之说。继AlphaGo击败李世石、AI绘画大火之后，ChatGPT成为又一新晋网红。下面是谷歌全球指数，我们可以看到火爆的程度。
在这里插入图片描述
国内对比各大平台，最先火起来是在微信上，通过微信指数我们可以看到，97.48%来自于公众号，开始于科技圈，迅速拓展到投资圈等。我最先了解到ChatGPT相关信息的也是在关注的科技公众号上，随后看到各大公众号出现关于介绍ChatGPT各种震惊体关键词地震、杀疯了、毁灭人类等。随后各行各业都参与进来有趣的整活，问数学题，问历史，还有写小说，写日报，写代码找BUG…
在这里插入图片描述

1.3 背后的金主OpenAI

OpenAI是一个人工智能研究实验室，目的是促进和发展友好的人工智能，使人类整体受益。OpenAI原是非营利机构，但为了更好地实现产研结合，2019年3月成立OpenAI LP子公司，目的为营利所用。

2019年7月微软投资双方将携手合作，2020年6月宣布了GPT-3语言模型，刷新了人们对AI的认知。GPT系列语言模型让我们不断对通用人工智能（AGI）充满了期待。

OpenAI目标之初就很远大，解决通用人工智能问题，主要涉及强化学习和生成模型。

强化学习最早被认为是实现人类通用智能重要手段，2016年DeepMind开发的AlphaGo Zero 使用强化学习训练，让人类围棋的历史经验成为了「Zero」，标志着人类向通用型的人工智能迈出了重要一步。2019年OpenAI 在《Dota2》的比赛中战胜了人类世界冠军。OpenAI在强化学习有很多深入的研究，Dactyl也是一款OpenAI通过强化强化学习训练能够高精度操纵物体的机器人手，OpenAI Gym是一款用于研发和比较强化学习算法的工具包，所以ChatGPT中使用强化学习也是顺理成章。

生成模型方面，为我们熟知的是GPT-3，这是一个强大的语言模型能够生成人类一样流畅的语言。DellE 2是最近很火的AI绘画根据文本描述生成图片。Codex是和微软合作通过github代码训练而来，可以生成代码和Debug，已经商业化。

作为OpenAI曾经的创始人伊隆·马斯克也发表了对ChatGPT的评价！
在这里插入图片描述 <