聊聊当下火热的通用人工智能--ChatGPT引爆的大模型时代

2 篇文章 0 订阅
2 篇文章 0 订阅

前言

ChatGPT目前人工智能领域实在是IT界火热的名字,使IT、互联网又火热了一把,与以往不同,这次着实让模型、算法、AI、大模型、超大规模训练、千亿级参数等不绝于耳。作为一个入门,下面进行一些简单的学习总结。

# 一些较好CSDN的文章

一文带你了解爆火的Chat GPT

结合ChatGPT的微软New Bing体验到底如何?

ChatGPT简要解读(一) - 原理分析与性能提升篇

人工智能里程碑ChatGPT之最全详解图解

ChatGPT技术原理解析:从RL之PPO算法、RLHF到GPT4、instructGPT

ChatGPT——目前还只能是GPT

ChatGPT(全名:Chat Generative Pre-trained Transformer),美国OpenAI 研发的聊天机器人程序,于2022年11月30日发布 。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。–来自百度百科

OpenAI于2015年由一群科技领袖,包括山姆·阿尔特曼(Sam Altman)、彼得·泰尔(Peter Thiel)、里德·霍夫曼(Reid Hoffman)和埃隆·马斯克(Elon Musk)等人创办。

ChatGPT技术:人工智能技术驱动的自然语言技术,架构:Transformer神经网络,也是GPT-3.5架构。注:GPT-4能力已经证明更强大了。GPT-5预计2023年11月发布。真得发展太快了。(算法+算力(CPU+GPU)改变了世界,算法工程师由此证明具有改变世界的能力,最终能把自己革命掉,除了算法,还只能是算法!!–个人意见)

这是一种用于处理序列数据的模型,拥有语言理解和文本生成能力,尤其是它会通过连接大量的语料库来训练模型,这些语料库包含了真实世界中的对话,使得ChatGPT具备上知天文下知地理,还能根据聊天的上下文进行互动的能力,做到与真正人类几乎无异的聊天场景进行交流。ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

在Open AI接连对ChatGPT迭代升级的背景下,国外大厂争相推出旗下有关AI的最新应用,先是微软正式推出GPT-4,对ChatGPT进一步升级迭代,随后,谷歌Bard开放测试,英伟达GTC召开、Midjourney V5、Runway 推出一句话生成视频等热点频出。

不过,引领风潮的仍然非ChatGPT莫属。具体来看,此前Open AI发布的GPT-4参数达到10万亿,要知道,GPT-3.5的参数仅仅在1750亿左右,并且GPT-4已经支持多模态输入、输入输出容量大幅提升、推理能力也大幅提高,可以在图像的基础上给出一些分析结果、得出一些结论等。

ChatGPT的野心:一统所有 AI 模型入口,四步实现文本分类、图像生成等 24 种复杂任务。这个确实强大!!

2023年很多软件领域的考试都考了,如《2023年上半年系统集成项目管理工程师》第二题:定位ChatGPT为人工智能驱动的自然语言处理工具!!

ChatGPT的关键特点:

本部分原文链接:https://blog.csdn.net/qq_67531269/article/details/129252670

  1. 强大的基座模型能力(InstructGPT)
  2. 大参数语言模型(GPT3.5)
  3. 高质量的真实数据(精标的多轮对话数据和比较排序数据)
  4. 性能稳定的强化学习算法(PPO算法)
  5. 内容安全

为了保证 ChatGPT 的温和无害,OpenAI 建立了一个额外的安全机制。

它基于涉及暴力、仇恨和性虐等内容的例子,训练出能够检测有害内容的 AI,再把这个 AI 作为检测器,内置到 ChatGPT 之中,在内容到达用户之前,起到检测和过滤的作用。

以上例子需要经过数据标注(Data labelling),这是一项浩如烟海的人力劳动,由肯尼亚的工人们负责,为有害内容打上标签。

从 2021 年 11 月起,OpenAI 向外包公司 Sama 发送了数万个文本片段,其中大部分体现着互联网最黑暗的角落,涉及性虐、自杀、酷刑等内容。

《时代周刊》调查发现,为 OpenAI 工作的 Sama 数据标注员,工资约为每小时 1.32 美元至 2 美元。他们每 9 小时轮班,阅读和标注 150 至 250 段文字,每段从 100 个单词到 1000 多个单词不等。

大模型训练的产物

获得这样一个功能,一定是先有一个通用的基模型,必须是全面、全修的,各种各样的数据它都见过,而且模型的参数在百亿级别以上,像chatGPT3.5用了1750亿个参数。有了一个比较全修的底层数据,然后经过很多次训练和打磨之后 ,具备了较高的通用能力,也就是能理解输入内容和意图,然后在专业领导,也就是垂直领域的数据再去做一个垂直领域的模型,这样垂直领域(专业领域)的这个模型的效果它才会足够的好。

大数据、算法、算力资源

在AI大模型时代,数据、算法和算力这三要素在经历新的演变,大模型参数量将以指数级的速率提升,而数据量随着多模态的引入也将大规模增长,必然会导致算力需求的剧增。特别是高性能显卡的占有,目前英伟达已经对我们进行了A100及更高性能显卡的断供。可见这东西的门槛很大程度是上对硬件的堆积出来,同时印证了涌现出现的重大基础条件。

理解一些名词:

AGI: 即“Artificial general intelligence”的简写,计算机科学与技术专业用语,专指通用人工智能。这一领域主要专注于研制像人一样思考、像人一样从事多种用途的机器。这一单词源于AI,但是由于主流AI研究逐渐走向某一领域的智能化(如机器视觉、语音输入等),因此为了与它们相区分,增加了general。

AIGC: 即“AI generated content”的简写,又称生成式AI,意为人工智能生成内容。例如AI文本续写,文字转图像的AI图、AI主持人等,都属于AIGC的应用。

AIDC: 即“Auto Identification and Data Collection”的简写,自动标识与数据采集(AIDC)指的是不用键盘直接将数据输入计算机系统、可编程逻辑控制器(PLC)或者其他微处理器中。它包括条形码、射频标识与射频数据通讯、磁条、语音和视觉系统、光学字符识别、生物统计等。每种技术都有其优点,适合不同的应用场合。。

Emergent: 涌现,基于大模型去训练,真正达到一定规模后,模型会表现出非常好的通用能力,然后各种能力都表现出来。

目前AI较擅长的工作

1. 传统AI比较擅长的工作

家居、制造、金融、医疗、安防、交通、零售、教育和物流等多领域。

2. 目前AI的新能力

1 作画能力:AI 作画的能力已经成为大模型的「标配」,如Midjourney。
2 聊天与理解能力:比传统聊天更能理解意思,还能提供可行方案与建议
3 代码生成能力:把github上的代码学完,已经能够生成一定功能的代码,还能进行优化。
4 考试能力:已经能理解考题,很多专业的考试:如高考、司法等都快能胜任了,而且比一般人都强。
5 其他能力:如作诗等。
补充一下:Midjourney作为一种新兴的AI绘画工具,正在深刻地影响着人们的艺术创作方式和艺术审美观念。它改变了人们的艺术创作方式,促进了艺术和科技的融合,对艺术市场产生了影响,同时也改善了艺术教育。

ChatGPT

下面是官网的一些介绍:

在这里插入图片描述
可是看出,介绍的很牛,能做任何事情,针对不同任务提供了不同水平能力的模型(对 a spectrum of models翻译可通常太准确)。

在这里插入图片描述
这个模型是一个经过训练的前沿语言模型,目前擅长的领域有内容生成、生成摘要(凝练主题)、分类,情绪分析、数据提取、翻译、更多等。

用好GPT的关键

  1. 敲定好场景、角色。
  2. 用好提示语,听说训练这个东西的工程师能到年薪70W+。
  3. 及时反馈给GPT,让他修正在之前的内容或补充内容。

接下来的任务:

在这里插入图片描述

国内的一些AI项目

1 百度:文心一言
2 商汤:日日新

一些给当下AI造势的言语

AI不一定能取代人类,但懂AI的人一定能取代你。
AI暂时不能取代人类,但懂AI的人一定能取代一些职位。
AI不一定能取代人类,但懂AI的程序员一定能取代你。

程序员关注的一些问题

引用《对话 ClickHouse CTO Alexey:目光不仅限于成为最快的数据库》
https://blog.csdn.net/csdnnews/article/details/130888782

- 未来的程序员在起步阶段就能使用 Copilot 和 ChatGPT,他们还需要学习这些基本编程技能吗?
       
       Alexey :可以不学,但 AI 会让那些学习基础知识的人更有价值。因为当 AI 出错的时候,只有这些人能够找出并修复 AI
       的问题。在未来,也许对低质量工程师的需求会减少,但对高质量工程师的需求甚至还会继续增加。

  - 在中国,每年有 1000 万大学毕业生,其中大概有 10% 是与计算机科学相关的专业,比如计算机科学、软件工程和嵌入式系统等等。所以很多人担心自己只能编程 10-15 年,并在 35 岁左右退休,中国开发者称之为“35 岁现象”。欧洲的程序员是否有类似的担心?
         
		Alexey :如果是一个有独特经验的优秀程序员,那就不用担心,这样的程序员就和那些经验老道的律师或医生一样,总能找到适合自己的路。

  - 在未来,AI 能处理掉这些无聊的部分,如CRUD部分,然后留下有趣的部分。
         
		Alexey :我建议不要把所有的精力花在工作上,任何工作都会有无聊的部分。但如果发现自己其实不是厌恶工作,
		而是真的不喜欢计算机科学工程,**那确实可以考虑换个大学或专业了——不要选择美术之类的,**
		因为这些行业也正在被有趣的 AI 取代。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值