我用大模型训练出9个数字员工,一个人开家公司不再是梦

8月30日,由创业邦主办的2023AIGC技术应用大会在深圳举行。本届大会以“元载万物·智启新界”为主题,旨在聚焦AIGC技术的创新应用,打造深入探索AIGC产业落地的交流平台。

会上,360集团副总裁梁志辉带来了360智脑大模型应用落地实践的最新产品和场景,其中精彩观点如下:

大模型的时代,最容易取代你的并不是AI,而是比你先掌握AI的一些人。

很多企业希望能够充分利用大模型的优势:内容生成、内容理解和逻辑推理。所以我们针对这几个需求,希望把大模型的能力充分发挥在企业最需要的地方。

以下为演讲内容,由创业邦整理:
在这里插入图片描述

大模型驱动的数字人将颠覆生产关系

大模型的时代,最容易取代你的并不是AI,而是比你先掌握AI的一些人。

在这过程中我们认为大模型它更接近工业革命,我们相信未来不会只有一个大模型,未来每个公司、每个大企业都会训练自己的大模型。刚才前面有些嘉宾也提到了,其实大模型发展方向是把它做小和做专,我们希望以后能够把大模型能力赋能到百行千业,中小企业和大型企业都能用得上。

在这过程中,企业场景里去落地大模型会遇到什么问题呢?

一方面,作为一个中国企业,你很难用一个美国的ChatGPT。国内虽然也有很多类似的一些产品了。但这类大模型它可能会存在几个问题:一是数据可能会泄漏。二是大模型的幻觉以及知识更新的问题,会让它在很多企业内部无法使用。第三,如果你去建立一个私有的大模型,其实很多训练大模型的数据,它是没办法做分级管理的。

很多企业很难去训练自己的大模型,首先这个资金投入上会很大,并且对很多企业的员工来说比较费时费力。一个企业的IT部门去学会建自己的大模型、训练一个大模型很贵,会训练大模型的工程师更贵,正常来说一台A100,价格大概在150万,但是一个会用A100的工程师至少是两三百万年薪起,这是很多企业很难把大模型落地到自己的内部的原因所在。

目前我们正在积极拥抱大模型加Agent方向的一些能力。我们尝试了很多新的方案,我们的底层不只有一个千亿大模型,我们还会有一些百亿大模型。其中有些百亿大模型专门解决交流对话,有些专门解决文档分析。我们目前已经能够让多个大模型协同工作。

在这个大模型之上我们会构建一套AI Agent中间件平台,让绝大部分的用户不用直接用大模型,而是通过一些更友好的、角色代入、数字人的形式去使用,同时让大模型结合外部的信息进行数据学习。360本来也是国内第二大搜索引擎公司,因此们跟搜索上也做了很多的结合,让大模型学会进行一些信息的爬取,让一些API能够接入。

具体到落地场的景,我们就是希望能解决两个问题。第一,对内能够降本增效。第二,能够提升数字人交互的自由度。

先说降本增效。这种既有最强大脑又有最佳外表的数字人能够7×24小时替你工作。我们可以给很多企业产出一些这种对外有互动功能的输出型数字人,例如数字名人、数字客服、数字销售、数字主播等。

在数字人这一块,其实我们今天在很多平台上也看到了一些数字人形象的产品,但他不见得是基于真人。目前来说我们也看到小红书上的一些号,其实它都已经是AI生成的。今天我们希望把这种技术提升到另外一个阶段,我们希望这个人他有最佳的形象,他甚至可以跟你说话,可以做情感陪伴或者甚至可以帮你工作。

在前两年大家谈到的数字人很多都是这种影视级的数字人,比如说什么希加加、柳夜熙。但是这样的数字人有一个很核心的问题,首先它每一分钟的内容生产成本超过10万,在这种场景下你只能把它当成一个拍电影的方式来进行运营,绝大部分企业是用不起来的。

再来说自由交互。现在很火的能做形象客服的数字人,也存在一定的问题。我们跟很多这种终端用户交流后发现,如果今天要做一个直播的话,用这样的数字人是很容易被封号的。为什么呢?因为很多观众看到我跟你交流,你不进行回答的话,他会怀疑你这个视频实际上是录播。我们问过同行,就类似于这样的一些形象克隆数字人,他被封号的概率超过40%,因为很多人其实是能看出来这是个假的。

所以在这种场景,我们希望基于大模型去构造的数字人能够实现跟人之间的自由对话,他每次对话的延迟控制在3秒以内,目前来说这个我们已经做到了。并且,他是可以有记忆、有灵魂的。那为什么叫有记忆呢?实际上所有人跟它说过的话,今天你告诉他我的女朋友,或者我老婆什么时候出生的、什么时候认识的,他可以把这个信息记住,下次再跟你聊的时候他不会像一个全新的操作系统一样每次都会遗忘。再者他会主动上网学习一些最新的资讯,能够根据最新的热搜来帮你编辑一篇小红书的文案,而不是胡编乱造。

化成具体的角色,今天我们已经能够用大模型生成数字客服、数字销售、数字主播和数字名人,后面我们会有一些具体例子可以看到。

像这样一个“数字老周”,其实就是我们做的一个案例。第一次做这个案例的时候是因为他阳了,出席不了某次大会,后来发现这种方式非常好。为什么呢?因为这样的视频其实我们后来给不同级别的领导都看过,反响非常不错。只需要一张照片、一段音频就能复刻我的形象、我的声音。只要把演讲稿、把他过往写过的书输入就能获得他的这种说话风格。

同时我们也可以用这样的一种形式解决直播带货的问题。例如,数字人可以在直播间里面自动抓取一些问题来自己回答。在这种互动场景中,看直播的用户不会觉得它是个数字人,他以为就是一个真人。同时在很多文旅和客服的场景里都需要有一个人亲自给你做接待、销售、介绍,今天有了这套大模型,以及AI Agnet的平台之后,我们可以让这样的一个数字人更好的带入自己的角色。它可以看得见、听得懂、说得好,它能够克隆你的形象、声音、动作以及思维,可以非常自然的进行人与人之间的交互。

像这样的数字人我们其实是做给安徽省的新华书店的。未来我们可以看到,有可能在书店里有一个无人区,这个区域所有的图书推荐都是由这个数字人来完成。通过这样的数字人,以及大家看到的老周的演讲,大家已经知道它已经是一个完成度比较高的产物了。在这个过程里面,实际上“数字老周”可以完成PPT的演讲,甚至在很多场景中还可以做这种类似于自由的对答。

从大模型到数字员工, 赋能企业最需要的场景

我们关注到很多企业希望能够充分利用大模型的优势:内容生成、内容理解和逻辑推理。所以在这个过程里面我们针对这几个需求,希望把大模型的能力充分发挥在企业最需要的地方。

我们希望大模型可以变成员工的知识助手、办公助手和领导的决策助手。比如说,以往总监或者是总经理以上一般才有自己的助理,这个高级领导让底下的助理帮他写一些文案,做一些内容分析,以及去安排一些会议。但是我们会发现很多企业里面不只是领导需要这样的一个数字员工,其实每个员工本身也希望有不同的助手能够帮他去做这些文案的撰写、行研的分析,以及类似这种多模态的音视频创作。

在这个过程里面,实际上我们做了一个AI数字员工的平台,在默认的情况下我们已经预训练出来9个AI数字员工。在这9个AI数字员工里面有能帮你写文案的、能帮你做社媒分析的、有能帮你做翻译的。在这种场景中我们还挖掘了一些新的应用出来,也就是说怎么样让几个AI数字人工能够帮你去协同完成一个任务。

我们的产品里面支持企业知识库,所以我也许未来一个人开一家公司不是梦想。大家可以利用AI来完成很多执行上、协作上、内容分析上的工作。同时我们关注到,由于大模型的内容生成能力非常强,所以我们根据很多企业的一些应用场景,把这种类似于写工作报告,写一些周期性有固定格式的文档工作交给大模型。

我们就以写公文为例,以前一个小时最多写个一千字,但是在我们的AI数字员工的帮助下一个小时可以写一万字。同时我们可以利用我们的360鸿图的能力来进行生图。过去其实我们360也有这种大量图片的需求,因为我们是一个搜索引擎,我们有大量的推广物料要持续产出。

所以在这种场景中,AI数字员工率先在360内部使用起来。我们每张图的生产时间大概是2-3分钟之间,如果要找设计师去做这样的一张图,他即使用视觉中国的图修改,一天最多做十张、八张就了不起了。现在我们一个搜索关键词对应一个配图,源源不断地让AI来生成,一天生成10万张还是100万张,其实取决于我们部署多少算力。

很多企业内部其实都会有文档分析的需求,在我们的AI数字员工里,我们试过把一个非常长的文章让AI进行分析和训练。同样的一份文档,如果真人去做阅读、分析、理解、总结,那可能几个小时就过去了。但让AI来做这个事情,200页的财报,可能10分钟它就可以给你提炼,你可以从各种角度来对它进一步分析。

对于企业用户来说,我们如果要写一个文档,做一个行业分析,你首先要让大模型知道你的企业是干什么的。所以我们提供了一种非常轻量级的,基于知识库的大模型工具。企业相关的知识,很多场景里其实都是以文档来呈现的。

你可以导入一些网站和数据,在这种场景中你去建立自己的一个知识库大模型将会非常快、非常轻便。传统的大模型预训练大概要花一个月,做微调也要花大概一周的时间。基于我们企业级的大模型训练方案,你只要把几百兆的文档上传,那我们的训练时间在一个小时之内就能完成。

如何学习大模型 AGI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

-END-


👉AGI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉AGI大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉AGI大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值