随着ChatGPT3.5/4.0的发布,AIGC一下子热了起来,这个热不是口头上的,而是实际行动上的。
热度是真实存在的,因为他正在改变当前的工作生产方式,改变是否是革命性不得而知,但确确实实影响着大批量的知识工作者。以往的自动化一般针对的是体力劳动者,但这次对象已经发生了变化,变化来得也更加凶猛,更加有冲击力。不等死就只能迎难而上,拥抱改变,迎接蜕变。
目前来看国内大厂纷纷入局,发布自己的大模型,除了百度、阿里、腾讯、字节、华为,360、京东(ChatJD)、AI四小龙(商汤、旷视)、国内高校或科研院所(复旦的MOSS等)都相继发布。成果如何还未可知,希望迎头赶上,促使国产大模型的基础设施层坚固可用。
同时,随着陆奇关于AIGC新模式的分享,从信息系统到模型系统到行动系统,目前正在跨入模型系统的时代,如何利用大语言模型进行模型系统的进化。人们或许会恐慌,当大语言模型掌握了现有所有知识的前提下,当人获取信息的时间和成本将会非常低或趋于0时,人的未来唯一有价值的就是具体独到的洞察和见解,也给以后的人才模型定了一个大的方向,当然不管是过去、现在、将来,这个方向一致没有变过,以不变应万变才是不断奋斗的方向。
不过,也不要过于悲观,人工智能并不能无监督的模式下发展出涌现的能力,就现在的成果来看,它带着非常明显的西方普世价值观,掌握的绝大部分是英语世界的知识(英语占92%以上),并且是截止过去某个时点的知识,而在一些国家明确禁止接入的情况下,知识的获取也可能存在问题,没有最广泛的知识,最新最全的知识,就无法给出最合理最新的回答。同时,还带着非常强的RHLF增强学习,这样才能生成真正人类需要的信息。
那对于大家的机会是什么?其实现在也基本给出了比较明确的答案。那就是对于非底层的厂商,就是如果利用用户的反馈和专业的数据和知识,训练出所处专业领域的模型。换句话说,谁掌握了哪个行业的专业数据和知识,就能够在基于少量专业知识的前提下,训练出这个行业的大模型,然后服务于这个行业的方方面面。
稍微展开一下,AIGC类比软件体系的方法论,可分为3层:
1、基础设施层(基础模型层):这一次的成本非常大,GPU、数据量的多少最终确定了模型的可性度、可用度。目前OpenAI的训练集大部分是基于英语资料,占92%,中文资料少2%左右。所以中文的结果比英文的结果会差一些。一方面中文资料在各私有化的网络中,无法获取,安全要求的前提下,很难公有化。但对于公开的信息,依然可以做通用大语言模型的训练,也是AIGC的前提。基础设施层由于成本大,数据多,适合大厂进行投入或联合完成,确切的结论是小公司是不可能有能力进行这方面投入的。
2、专业模型层:即利用专业的数据和知识,利用实时实际的用户反馈,训练专业的知识模型,服务业业务应用层。
3、业务应用层:利用基础模型层和专业模型层的技术,在前端客户应用层面,寻找应用场景,包括但不限于内容生成、任务执行、智慧客服以及研发内部的降本提效。比如内容生成中的会议纪要生成、内容简介摘要生成、图片生成、视频生成等,内容生成再结合现在的互联网技术,将会给客户带来更大的体验。比如任务生成中的定制报表、短信生成等,结合已有的平台和数据,基于任务生成结果,快速、简洁、高效。比如智慧客服中的典型的知识问答机器人,客服服务机器人等。比如研发内部的代码辅助生成、代码审核辅助工具、运维预警监控等。不管是哪个维度,都能大大提升效率。当然不好的消息是一批简单、重复性工作人员可能面临失业的危险,因为未来需要洞察和见解。
总的来说,面向AIGC,不必恐慌,做马车升级到汽车的司机,让自己成为具体独到的洞察和见解,并利用AIGC为自己服务,利用好这次变革,成为一个会使用AIGC的人,而不是被AIGC所取代。