聊聊当下火热的通用人工智能--ChatGPT引爆的大模型时代

jiguang127

已于 2024-03-30 15:35:43 修改

阅读量428

点赞数

分类专栏：人工智能机器学习 AI 文章标签：人工智能 chatgpt 机器学习

于 2023-04-13 08:43:14 首次发布

本文链接：https://blog.csdn.net/jiguang127/article/details/130103100

版权

人工智能同时被 3 个专栏收录

2 篇文章 0 订阅

订阅专栏

机器学习

2 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

前言

ChatGPT目前人工智能领域实在是IT界火热的名字，使IT、互联网又火热了一把，与以往不同，这次着实让模型、算法、AI、大模型、超大规模训练、千亿级参数等不绝于耳。作为一个入门，下面进行一些简单的学习总结。

# 一些较好CSDN的文章

一文带你了解爆火的Chat GPT

结合ChatGPT的微软New Bing体验到底如何？

ChatGPT简要解读(一) - 原理分析与性能提升篇

人工智能里程碑ChatGPT之最全详解图解

ChatGPT技术原理解析：从RL之PPO算法、RLHF到GPT4、instructGPT

ChatGPT——目前还只能是GPT

ChatGPT（全名：Chat Generative Pre-trained Transformer），美国OpenAI 研发的聊天机器人程序，于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具，它能够通过理解和学习人类的语言来进行对话，还能根据聊天的上下文进行互动，真正像人类一样来聊天交流，甚至能完成撰写邮件、视频脚本、文案、翻译、代码，写论文等任务。–来自百度百科

OpenAI于2015年由一群科技领袖，包括山姆·阿尔特曼（Sam Altman）、彼得·泰尔（Peter Thiel）、里德·霍夫曼（Reid Hoffman）和埃隆·马斯克（Elon Musk）等人创办。

ChatGPT技术：人工智能技术驱动的自然语言技术，架构：Transformer神经网络，也是GPT-3.5架构。注：GPT-4能力已经证明更强大了。GPT-5预计2023年11月发布。真得发展太快了。（算法+算力（CPU+GPU）改变了世界，算法工程师由此证明具有改变世界的能力，最终能把自己革命掉，除了算法，还只能是算法！！–个人意见）

这是一种用于处理序列数据的模型，拥有语言理解和文本生成能力，尤其是它会通过连接大量的语料库来训练模型，这些语料库包含了真实世界中的对话，使得ChatGPT具备上知天文下知地理，还能根据聊天的上下文进行互动的能力，做到与真正人类几乎无异的聊天场景进行交流。ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

在Open AI接连对ChatGPT迭代升级的背景下，国外大厂争相推出旗下有关AI的最新应用，先是微软正式推出GPT-4，对ChatGPT进一步升级迭代，随后，谷歌Bard开放测试，英伟达GTC召开、Midjourney V5、Runway 推出一句话生成视频等热点频出。

不过，引领风潮的仍然非ChatGPT莫属。具体来看，此前Open AI发布的GPT-4参数达到10万亿，要知道，GPT-3.5的参数仅仅在1750亿左右，并且GPT-4已经支持多模态输入、输入输出容量大幅提升、推理能力也大幅提高，可以在图像的基础上给出一些分析结果、得出一些结论等。

ChatGPT的野心：一统所有 AI 模型入口，四步实现文本分类、图像生成等 24 种复杂任务。这个确实强大！！

2023年很多软件领域的考试都考了，如《2023年上半年系统集成项目管理工程师》第二题：定位ChatGPT为人工智能驱动的自然语言处理工具！！

ChatGPT的关键特点：

本部分原文链接：https://blog.csdn.net/qq_67531269/article/details/129252670

强大的基座模型能力（InstructGPT）
大参数语言模型（GPT3.5）
高质量的真实数据（精标的多轮对话数据和比较排序数据）
性能稳定的强化学习算法（PPO算法）
内容安全

为了保证 ChatGPT 的温和无害，OpenAI 建立了一个额外的安全机制。

它基于涉及暴力、仇恨和性虐等内容的例子，训练出能够检测有害内容的 AI，再把这个 AI 作为检测器，内置到 ChatGPT 之中，在内容到达用户之前，起到检测和过滤的作用。

以上例子需要经过数据标注（Data labelling），这是一项浩如烟海的人力劳动，由肯尼亚的工人们负责，为有害内容打上标签。

从 2021 年 11 月起，OpenAI 向外包公司 Sama 发送了数万个文本片段，其中大部分体现着互联网最黑暗的角落，涉及性虐、自杀、酷刑等内容。

《时代周刊》调查发现，为 OpenAI 工作的 Sama 数据标注员，工资约为每小时 1.32 美元至 2 美元。他们每 9 小时轮班，阅读和标注 150 至 250 段文字，每段从 100 个单词到 1000 多个单词不等。

大模型训练的产物

获得这样一个功能，一定是先有一个通用的基模型，必须是全面、全修的，各种各样的数据它都见过，而且模型的参数在百亿级别以上，像chatGPT3.5用了1750亿个参数。有了一个比较全修的底层数据，然后经过很多次训练和打磨之后，具备了较高的通用能力，也就是能理解输入内容和意图，然后在专业领导，也就是垂直领域的数据再去做一个垂直领域的模型，这样垂直领域（专业领域）的这个模型的效果它才会足够的好。

大数据、算法、算力资源

在AI大模型时代，数据、算法和算力这三要素在经历新的演变，大模型参数量将以指数级的速率提升，而数据量随着多模态的引入也将大规模增长，必然会导致算力需求的剧增。特别是高性能显卡的占有，目前英伟达已经对我们进行了A100及更高性能显卡的断供。可见这东西的门槛很大程度是上对硬件的堆积出来，同时印证了涌现出现的重大基础条件。

理解一些名词：

AGI: 即“Artificial general intelligence”的简写，计算机科学与技术专业用语，专指通用人工智能。这一领域主要专注于研制像人一样思考、像人一样从事多种用途的机器。这一单词源于AI，但是由于主流AI研究逐渐走向某一领域的智能化（如机器视觉、语音输入等），因此为了与它们相区分，增加了general。

AIGC: 即“AI generated content”的简写，又称生成式AI，意为人工智能生成内容。例如AI文本续写，文字转图像的AI图、AI主持人等，都属于AIGC的应用。

AIDC: 即“Auto Identification and Data Collection”的简写，自动标识与数据采集（AIDC）指的是不用键盘直接将数据输入计算机系统、可编程逻辑控制器（PLC）或者其他微处理器中。它包括条形码、射频标识与射频数据通讯、磁条、语音和视觉系统、光学字符识别、生物统计等。每种技术都有其优点，适合不同的应用场合。。

Emergent: 涌现，基于大模型去训练，真正达到一定规模后，模型会表现出非常好的通用能力，然后各种能力都表现出来。

目前AI较擅长的工作

1. 传统AI比较擅长的工作

家居、制造、金融、医疗、安防、交通、零售、教育和物流等多领域。

2. 目前AI的新能力

1 作画能力：AI 作画的能力已经成为大模型的「标配」，如Midjourney。
2 聊天与理解能力：比传统聊天更能理解意思，还能提供可行方案与建议
3 代码生成能力：把github上的代码学完，已经能够生成一定功能的代码，还能进行优化。
4 考试能力：已经能理解考题，很多专业的考试：如高考、司法等都快能胜任了，而且比一般人都强。
5 其他能力：如作诗等。
补充一下：Midjourney作为一种新兴的AI绘画工具，正在深刻地影响着人们的艺术创作方式和艺术审美观念。它改变了人们的艺术创作方式，促进了艺术和科技的融合，对艺术市场产生了影响，同时也改善了艺术教育。

ChatGPT

下面是官网的一些介绍：

在这里插入图片描述
可是看出，介绍的很牛，能做任何事情，针对不同任务提供了不同水平能力的模型（对 a spectrum of models翻译可通常太准确）。

在这里插入图片描述
这个模型是一个经过训练的前沿语言模型，目前擅长的领域有内容生成、生成摘要（凝练主题）、分类，情绪分析、数据提取、翻译、更多等。

用好GPT的关键

敲定好场景、角色。
用好提示语，听说训练这个东西的工程师能到年薪70W+。
及时反馈给GPT，让他修正在之前的内容或补充内容。

接下来的任务：

在这里插入图片描述

国内的一些AI项目

1 百度：文心一言
2 商汤：日日新

一些给当下AI造势的言语

AI不一定能取代人类，但懂AI的人一定能取代你。
AI暂时不能取代人类，但懂AI的人一定能取代一些职位。
AI不一定能取代人类，但懂AI的程序员一定能取代你。

程序员关注的一些问题

引用《对话 ClickHouse CTO Alexey：目光不仅限于成为最快的数据库》
https://blog.csdn.net/csdnnews/article/details/130888782

- 未来的程序员在起步阶段就能使用 Copilot 和 ChatGPT，他们还需要学习这些基本编程技能吗？
       
       Alexey ：可以不学，但 AI 会让那些学习基础知识的人更有价值。因为当 AI 出错的时候，只有这些人能够找出并修复 AI
       的问题。在未来，也许对低质量工程师的需求会减少，但对高质量工程师的需求甚至还会继续增加。

  - 在中国，每年有 1000 万大学毕业生，其中大概有 10% 是与计算机科学相关的专业，比如计算机科学、软件工程和嵌入式系统等等。所以很多人担心自己只能编程 10-15 年，并在 35 岁左右退休，中国开发者称之为“35 岁现象”。欧洲的程序员是否有类似的担心？
         
		Alexey ：如果是一个有独特经验的优秀程序员，那就不用担心，这样的程序员就和那些经验老道的律师或医生一样，总能找到适合自己的路。

  - 在未来，AI 能处理掉这些无聊的部分，如CRUD部分，然后留下有趣的部分。
         
		Alexey ：我建议不要把所有的精力花在工作上，任何工作都会有无聊的部分。但如果发现自己其实不是厌恶工作，
		而是真的不喜欢计算机科学工程，**那确实可以考虑换个大学或专业了——不要选择美术之类的，**
		因为这些行业也正在被有趣的 AI 取代。

jiguang127

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
聊聊当下火热的通用人工智能--ChatGPT引爆的大模型时代

目前人工智能领域实在是IT界火热的名字，使IT、互联网又火热了一把，与以往不同，这次着实让模型、算法、AI、大模型、超大规模训练、千亿级参数等不绝于耳。作为一个入门，下面进行一些简单的学习总结。
复制链接

扫一扫