大模型真能变现!这批打工人,干着大厂的活,赚着副业的钱!!_大模型 变现

现在,已经有互联网大厂打工人用类GPT模型赚到钱了!

当你还在和ChatGPT尬聊时,已经有人用它搞到钱了。

前段时间,国外网友给ChatGPT 100美元自创业,搭建网址、内容策划、传播全都AI搞定,甚至LOGO都是由Dall-E设计的。

公司运作2天,估值飙升到25000美元。看到ChatGPT的羊毛这么容易薅,网友也纷纷按捺不住了。

在这里插入图片描述

其实,还有另一个用「ChatGPT」赚钱的门道,而国内已经有开发者,用ta赚到了第一桶金。

一次偶然经历,诞生一个项目

此前,无空从未能想到,一次在家「休假」的机会,竟然让自己做起了一个项目。

当时,被困家中的无空,和朋友一起报名参加了当地的志愿者。

而在服务中,他了解到,面对重大突发事件,基层管理中存在不少难题。

基层治理的困境之一,是人少事多。

比如在上海,一个街道/镇下属的居委会总共只有5-9个人,但需要对接3500-5000名居民,平均每个人要对接400-500人。

在这里插入图片描述

另一个困境,就是力小任大。基层人员素质不能保证,有的刚刚上手小白无法一时胜任工作任务。

因此,不少小区的管理运行陷入了困境,遇到极大挑战。

此时,无空和同伴萌生出一个想法:能否打造一个线上IT志愿者团队,也就是AI助理,来协助封控小区的基层管理呢?

说干就干,一个名叫「临小助」的数字社工助理火速诞生了。

值得一提的是,这些来自微软、百度等大厂的项目成员,在兼职的时间就把钱赚了。

在这里插入图片描述

「临小助」不仅能解答居民的提问,还能给社工做培训。

下面这个198个业务指导文档,可以说是基层工作者的噩梦了。

以往,他们只能死记硬背,苦不堪言。效率低不说,需要用的时候也未必能想得起来,或者根本找不到。

在这里插入图片描述

而临小助这个深度学习模型,就完全可以替代人脑的死记硬背,通过CUI对话式界面提供使用入口,犹如给基层人员增加了一个永不疲倦、永不失忆的「外脑」。
在这里插入图片描述

甚至,AIGC技术驱动的「数字人演员」,还能以「互动剧」的形式,和工作人员进行「对手训练」。

在这里插入图片描述

课程内容可搭载于基础的「数字人」系统(微信端 or IP端),也可以视频游戏、全沉浸式培训站的形式呈现。

在这里插入图片描述

那么,「临小助」的这些能力的实现就是用到了大模型「源1.0」的能力,主要体现在两个方面。

一是,使用了「源1.0」生产了许多数据去训练「临小助」模型。

因为模型在实际训练过程中,需要街道社工去采集真实用户的语料,然而这些语料是远远不够的。

因此,研发团队就让「源1.0」按照实际采集的语料做仿写,进而扩充语料。

另一方面,就是「临小助」的模拟居民和社工情景对话的功能,也是离不开「源1.0」加持。

情景对话的过程中,每一句话都是通过「源1.0」实时生成。

项目发起后,已经在上海市静安区临汾路街道和嘉定区安亭镇落地。

今年3月左右,一位静安区临汾路街道的社工才刚刚入职,就遭遇了难题:接待时,遇到了居民询问「如何申请共有产权保障房」。

还是小白的他求助了「临小助」,短短1秒钟,就得到了条理清晰的答案。

在这里插入图片描述

其实在「临小助」之前,无空曾基于「源1.0」开发了一个AI剧本杀的项目,并在GitHub上开源。

在这里插入图片描述

凭借「源1.0」零样本(Zero-Shot)和小样本(Few-Shot)学习的优势,AI模型可以很好地理解并实现交互式叙事的「对话策略」,运用「举一反三」的对话能力。

只要算一下就会发现,「临小助」这个项目的商业前景,可谓十分广阔。

按民政部网站数据,截至2020年底,中国共有38741个街道(镇、乡)级政府,按15%的渗透率计算,基础服务部分市场规模就已高达数亿每年。

在这里插入图片描述

动手做个「贾维斯」?

无独有偶,对未来前沿技术感兴趣的另一位开发者郭泽斌,便在想大模型和数字人结合,能够带来什么便利?

以往像Siri的数字助手都是通用的,郭泽斌希望能够一体化构建自己专属的数字人,不仅可以改变形象、音色,还能够在反馈中不断训练。

于是,他开始动手尝试做了一个数字人的项目——数字人Fay控制器,已在GitHub上收获了近1000星。
在这里插入图片描述

现在,一家公司基于这个项目做的产品应用,已经上机平板。

还有一家玩具公司已经基于这个技术,做出了与儿童情感交互的玩具,即将上市售卖。

除此之外,郭泽斌还设想了这个数字人其他的用例,比如做网红主播、电子导游、虚拟老师、前台指引等等。

那么这样的数字人该如何实现?

以直播带货为例,当一个粉丝点赞,另一个粉丝同时在骂主播,数字人该如何应对?

这就需要建立行为模型,来学习真实主播的性格。

具体操作就需要,把目标主播的直播录制下来,提取样本数据。

然后再训练一个从粉丝的不同刺激的组合,到主播的不同响应方式的多元逻辑回归的数学模型。

而在训练时用到的语料就包括「源1.0」。

在这里插入图片描述

值得一提的是,在中文语料上训练的「源1.0」,在中文的语义理解和识别上,更加准确。

另外,把现有主播性格模型数字化后,无法快速去调整性格特征。这就需要手动调节行为模型参数,而Fay控制器就是发挥这一作用。

在这里插入图片描述

数字人核心架构搭好了,就需要一副皮囊。

郭泽斌使用了UE4来作为模型的驱动引擎,人物选择上,可以是超写实的,也可以是二次元的。

这样一来,就可以通过Fay控制器为数字人设定人设、音色,形象,并在反馈中不断训练。

AI大模型时代的「安卓生态」

ChatGPT横空出世,无限放大了人工智能「涌现」能力。

随之而来的是,国内外许多大厂都在探讨要把AI用在哪,如何让这一「涌现」能力真正落地。

OpenAI在商业化前景上做了一个典范,通过开放API接口先行一步。

在这里插入图片描述

大模型能力不断跃迁,代表着AI大规模商业化时代的到来。

在OpenAI之外,是否可以让大模型像安卓系统一样,让开发者基于模型做各种APP,进而带来商业价值。

也就是说未来大模型商业化落地方向,可以将大模型作为基础设施,让开发者释放出价值。

从上面案例可以看到,开发者通过将「源1.0」与数字人相结合,由此实现了商业价值。

那么,大模型「源1.0」是一个怎样的存在呢?

2021年9月,浪潮发布了「源1.0」单体巨量自然语言处理模型。

在发布之初,就问鼎了全球最大规模的中文AI模型,其参数规模高达惊人的2457亿,而训练时采用的中文数据集的体量达到了5000GB。

相比于GPT-3的1750亿参数量和570GB的训练数据集,「源1.0」在参数规模方面碾压了GPT-3约40%,训练数据集规模领先近10倍。

但「源1.0」可不是「虚胖」。

刚一发布,就摘得了中文语言理解评测基准CLUE榜单的零样本学习和小样本学习的两项总榜冠军,同时登顶该榜单精简榜的榜首,还获得了语言理解(篇章级)、语言生成、对话交互、多语言、数学推理等5项评测最佳成绩。

「源1.0」小样本学习能力极强,能够适应多种类的AI任务。

在实用领域,搭载「源1.0」的智能客服机器人、虚拟数字人、文案撰写工具、智能内容处理等多种不同AI应用都已经和大家见面了。
在这里插入图片描述

现在让我们从表面立足,深入到「源1.0」的技术层面一探究竟。

在算法层面,「源1.0」采用Transformer结构,针对Attention层和前馈层的模型空间进行结构优化,改进注意力机制聚焦文章内部联系的学习。

在数据层面,中文训练数据一直存在海量数据难以获取、难以清洗,以及没有统一质量评估标准等等难题。而浪潮自研了针对海量数据的过滤系统(MDFS),建立一套全面的全自动端对端数据工作流程,包括数据采集、粗滤、质量分类、精滤等。

正是靠着MDFS,「源1.0」才成功的把866TB的海量数据清洗成了规模5TB的业界最大规模、最高质量的中文数据集。

在算力效率层面,大模型训练中一直存在计算模式复杂,算力集群性能较低的情况。

而「源1.0」创新地在大规模分布式训练中,采用了张量并行、流水线并行和数据并行的三维并行策略,首次提出面向效率和精度优化的大模型结构协同设计方法,围绕深度学习框架、训练集群IO、通信开展了深入优化。

在仅采用2x200G互联的情况下,「源1.0」的算力效率达到45%,远超MT-NLG与GPT-3等国际知名模型,领先全世界。

「源1.0」大模型实现推理算法创新,研发了可支持多元异构芯片部署的大模型推理软件框架,在400颗国产芯片集群上实现了大模型弹性部署,并将模型的推理性能提高了数10倍,形成大模型+大算力的算法基础设施建设的最佳实践。

在这里插入图片描述

现在,让我们再次从技术的深海中探出来,看看具备优秀的自然语言理解和自然语言生成的能力的通用的巨量中文AI模型 「源1.0」在下游领域的应用。

首先,「源1.0」支持「预训练+微调」的研发方式,可以用一套技术解决不同场景的NLP任务。这样做的好处是,开发者训练AI的效率大大提升,需要的训练数据量可以减少90%以上,开发周期大大减少,从年缩短到月。

其次,在文本生成方面,「源1.0」同样傲视群雄。

它可以生成各种风格、类型文本,如新闻资讯、金融行研、办公公文、法律文书、广告营销、网络文学、诗词歌赋,甚至连食谱菜谱都可以一键生成。

而从文本质量看,其原创性和连贯性都和人类的工作没有差别。「源1.0」作为一种工具,可以有效推动创作方式的转变,辅助人类创作,甚至完全进行自主创作。

同时,「源1.0」还具备记忆能力,可以扮演多种人物角色。

在这里插入图片描述

开源开放,构建大模型应用开发新生态

目前,「源1.0」已上线开放平台,开放模型API、开源高质量中文数据集、模型训练代码、推理代码、应用代码、面向AI芯片的模型移植开发代码。

而这也就是为什么从「源1.0」衍生出了那么多好玩的东西。

就比如,前面提到的首个可以跟人类玩「剧本杀」的AI剧本杀玩家。AI所扮演的角色不仅可以与其他玩家流畅对话,甚至还会「套路」人类玩家。

也正是因为「源1.0」数据集的开源,可以让开发者直接利用开源数据对自己的模型进行二次训练。

其模型训练精度得到了明显提升,训练结果甚至登顶CLUE基准评测榜单。

在其它领域,开发者们也利用「源1.0」搞出了不一样的东西。

最好玩的可能就是心理咨询领域的开发者用「源1.0」开发了一个「闹情绪」、心理状态不佳的求助者角色。而它在交流中表现出各种来自工作、生活、情感及人际关系等烦恼、压力及焦虑情绪等多样化问题。

此时,受训心理咨询师要在指定时间内了解情况、整理焦点、以助下一步跟进服务。

怎么样,神奇吧。

除了这些,还有数字演员、正能量陪伴机器人、抬杠机器人、游戏NPC对话、文案写作、金融文本分析等极具应用价值和创造力的应用。

别的不说,正能量陪伴机器人来几个送家人,抬杠机器人来几个送老板(不是)。

未来,「源1.0」将会应用于智能写作领域,逐渐覆盖公文写作、媒体、金融等行业。

总而言之,依托于「源1.0」进行开发的可能性非常之多。

毕竟,大模型潜力不可估量,未来也是值得每个人去不断挖掘和探索。

那么,如何系统的去学习大模型LLM?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

所有资料 ⚡️ ,朋友们如果有需要全套 《LLM大模型入门+进阶学习资源包》,扫码获取~

篇幅有限,部分资料如下:

👉LLM大模型学习指南+路线汇总👈

💥大模型入门要点,扫盲必看!
在这里插入图片描述
💥既然要系统的学习大模型,那么学习路线是必不可少的,这份路线能帮助你快速梳理知识,形成自己的体系。
在这里插入图片描述

👉大模型入门实战训练👈

💥光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

👉国内企业大模型落地应用案例👈

💥《中国大模型落地应用案例集》 收录了52个优秀的大模型落地应用案例,这些案例覆盖了金融、医疗、教育、交通、制造等众多领域,无论是对于大模型技术的研究者,还是对于希望了解大模型技术在实际业务中如何应用的业内人士,都具有很高的参考价值。 (文末领取)
在这里插入图片描述
💥《2024大模型行业应用十大典范案例集》 汇集了文化、医药、IT、钢铁、航空、企业服务等行业在大模型应用领域的典范案例。

在这里插入图片描述

👉LLM大模型学习视频👈

💥观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。 (文末领取)
在这里插入图片描述

👉640份大模型行业报告👈

💥包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
在这里插入图片描述

👉获取方式:

这份完整版的大模型 LLM 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值