ITValue
本文摘自《云栖战略参考》,这本刊物由阿里云与钛媒体联合策划。目的是为了把各个行业先行者的技术探索、业务实践呈现出来,与思考同样问题的“数字先行者”共同探讨、碰撞,希望这些内容能让你有所启发。
作者|张帅
首发|钛媒体
ITValue
本文根据作者与通义实验室创新业务中心负责人陈海青的对话整理
可以说,“百模大战”的开始有多喧嚣,结束就有多潦草。行业公认的是,基础预训练大模型最终将收敛到少数几家。更激进的观点是,当下百模大战已经结束,中国市场真正有实力留存下来做基础模型的厂商,或许不超过10家,未来随着市场竞争,这一数字可能还会进一步减少。
下一轮AI,接棒基础大模型热度的是大模型应用,美国市场当下以GPT和Llama为主导的闭源与开源大模型两大阵营已基本成型。所以在美国市场大家都开始卷应用,基本上没人再去卷基础模型,这也将成为中国市场接下来的发展方向。
对于企业而言,应用场景的技术能力迭代极快,对于降本提效有着更高的要求。灵活、便捷、低门槛便成为大模型应用开发的必备条件。在2023年云栖大会上,阿里云CTO周靖人发布了一站式大模型应用开发平台——阿里云百炼。
该平台集成了国内外主流优质大模型,提供模型选型、微调训练、安全套件、模型部署等服务和全链路的应用开发工具,为用户简化了底层算力部署、模型预训练、工具开发等复杂工作。开发者可在5分钟内开发一款大模型应用,几小时即可“炼”出一个企业专属模型,开发者可把更多精力专注于应用创新。
一款大模型应用,是如何千锤“百炼”而来?
01
AI Agent,
从基础模型到大应用的桥梁
大模型时代,所有APP都值得被重做一遍。
举个例子,假设一家金融公司做一个应用,原来的工作流模式是在垂直领域构建从算法、工程、产品到业务的闭环,从金融业收集数据,组建算法团队、产品团队,面向这个领域做分类,采用监督、无监督、半监督等深度学习的方法