春节尾声,OpenAI发布了“文生视频”工具Sora,“世界模拟器”的概念让所有人惊叹,堪称人工智能行业的一大步。
从2023年起,大模型的爆火给我们的生活提供了很多便利,包括一系列的AI+图像,AI+语音的项目应用已经正式投入生产。
2024年,我们已经进入AI大模型的2.0时代,从初步掌握AI大模型的应用,需要进行实实在在的大模型落地。因此2024年一定是AI原生的应用爆火的一年,我们作为技术人也需要好好跟上节奏。
今天给大家推荐一个既能学习开发AI模型的落地应用,也能赢一波奖金的好事!由借助百度智能云千帆AppBuilder和ModelBuilder两大智能开发助手,举办的千帆杯AI原生应用开发挑战赛,每期都有10万奖金,第一期的奖金就被一位99年山东小伙拿走,可见咱每位技术人员,都有机会拿大奖。
一、千帆杯开发挑战赛准备
本场比赛需参赛者使用百度智能云千帆平台,通过AppBuilder的Agent Builder创建应用。
使用工具:百度智能云千帆AppBuilder。
首先登录百度智能云千帆杯官网,进行报名
报名链接如下:
https://cloud.baidu.com/qianfandev/aimatch?track=qianfan
二、千帆杯挑战赛赛题解读
AI原生应用开发的需求源于实际的生活场景需求。百度智能云千帆杯的第一期赛题:游乐场排队规划助手。
2.1 赛题背景:随着春节假期来临,环球影城等热门主题游乐场成为大人孩子的经典过节选项,但巨大的人流也意味着排队成为游客最大的痛点,游乐场项目多、如何在有限的游玩时间内收获最大的快乐,是本期赛题要解决的问题。
2.2 第一期赛题的具体内容:
官方提供「环球影城」、「上海迪士尼」、「香港迪士尼」、「广州长隆」四个热门游乐场地图(地图信息见下图list),地图中标注各项目的排队+游玩时间、视觉体验指数、刺激指数,每个项目最多玩一次,不考虑项目之间的交通时间。
2.3 赛题具体解读说明:
通过以上的所给的环球影城地图来看,每一个影城景点,包含三个属性,排队+游玩的时长、视觉体验指数、刺激体验指数。可以将三种属性理解为代价+回报。
测试用例1:游玩5个小时,玩哪些项目的组合刺激指数最大?
限定时间为5小时,也就是300分钟,如果你的模型给出的游玩组合为组合为萌转过山车,鹰马飞行,飞越侏罗纪,霸天虎过山车,大黄蜂回旋机的价几个项目,则表示模型输出正确。
消耗时间:
萌转过山车(55分钟),鹰马飞行(60分钟),飞越侏罗纪(65分钟),霸天虎过山车(50分钟),大黄蜂回旋机(55分钟)
时间累计:55+60+65+50+55=285分钟
刺激指数计算:5+8+7+10+8=38
剩余的15分钟,已经不能再支撑游玩其他的景点,并且与其他的游玩方案之下,进行对比所得到的刺激指数最大。
测试用例2:只有120分钟的时间,怎么玩视觉指数最大?
最佳方案:奇遇迅猛龙,变形金刚:火种源争夺战
时间消耗累计:
35分钟+85分钟= 120分钟
视觉指数计算:
5+10 = 15
以上的实例是经过繁琐计算以及比对得到的,但是显然如此繁琐的建模以及计算,显然是不实际的,为了能够更加通用的解决这个实际难题,采用多模态的大模型对图片上的信息进行信息的读取,进行实际的推理计算比对。最终得到最最优的解法。
三、千帆杯挑战赛实操
那么现在我们已经明白了比赛题目的含义,技术开发有了需求问题,下面就是解决问题的环节,但是到底需要怎么解决问题呢?
以下是比赛官方作为参赛选手的任务:
* 从以上4个游乐场中任选一个,通过AppBuilder的Agent Builder创建应用,在应用名称中明确具体的游乐场,如「环球影城排队规划助手」
* 你将获得官方提供的若干问题示例以及参考答案,你的应用需要尽可能的满足用户类似问题,并返回准确的答案
* 本次赛题必须使用百度智能云千帆AppBuilder完成开发,可以使用Agent Builder中的任何工具
* 不允许使用暴力穷举和直接写代码计算的方式实现。
以上是比赛官方指定的规则,我们来看使用AppBuilder工具进行AI原生应用的开发流程:
3.1首先进入AppBuilder网页:
3.2进入创建应用菜单,选择需要创建的类型,选择官方指定的Agent Builder应用框架,使用“零代码创建”。须使用Agent Builder应用框架创建的大模型应用才是有效的。
3.3将游乐场的各个景点信息进行提取
由于项目暂时无法对地图中的各个经典的数据有效提取,需要人工对数据进行整理,即对游乐场的地图图片的有效数据信息整理为大模型接受的形式。
上面我曾经发布了环球影城的游乐园地图,通过以上的所给的环球影城地图来看,每一个影城景点,包含三个属性,排队+游玩的时长、视觉体验指数、刺激体验指数。
可以将三种属性理解为对一个游乐场景点进行游玩的代价以及或相应获得的回报。
从游乐园的地图上提出来的景点游玩信息整理如下:
将以上的提取出来的关键信息文档作为大模型的角色设定的“预备知识”,输入到角色指令之中,作为模型应用的预备知识,用于大模型应用的角色配置。
比赛的核心设计部分在于如何合理撰写大模型的人设角色匹配指令,以下是我进行大模型角色设定的参考指令:
你的角色是一个游乐园的智能旅游助手,你需要根据游客提出的游玩时长限定要求,对每一个景点进行组合计算出来,来为游客提供限定游玩时间内的最佳景点旅游路线组合。
再加入我们从游乐园地图上提取的关键信息数据进行输入,作为大模型应用的预备数据。
以下是对话实例:
游玩5个小时,玩哪些项目的组合刺激指数最大?
300分钟之内,刺激指数总和最大为38,组合为萌转过山车,鹰马飞行,飞越侏罗纪,霸天虎过山车,大黄蜂回旋机。
如下图所示:
3.4 角色设定的公式模板
Agent的角色设定+用户输入什么信息+大模型进行信息回复的样式+提供对话的样例。当热这只是推荐的预制模板,一定是的提示词越全面,大模型的性能就会越精准,选手们可以不断迭代进行调试出来。
3.5关于应用的模型与功能配置如下选中即可,推荐先使用官方的4.0模型进行流程的跑通。仅需勾选代码解释器,用于对数据进行代码逻辑计算。
3.6对大模型进行个性化测试用例的进行应用效果的检验:
最后将应用,点击发布即可完成AI原生参赛应用的制作。以下为完成应用的最终样式以及信息,表示创建应用完成。
3.7点击立即使用,进入搭建好的大模型应用进行实际的可使用性检测。
测试用例1:
测试用例2:
测试用例是通过代码解释器生成的Python代码执行的动态规划算法进行计算得到的。经过实际的数据验证,结果正确。其完整的准确度需要等待官方使用测试数据集进行统一验证!
可以看到会构建的AI原生应用已经可以进行在正常使用了。至此一个完整的AI原生大模型的应用开发结束。
四、千帆杯挑战赛的成果提交
将训练后的模型部署的应用进行评论提交,官方会通过提交的评论样式,自动切分得到选手所创建应用ID,再使用官方的检验测试集来验证所创建应用的性能,从而选出最佳的应用作为奖金获得者啦!参赛选手的提交作品的样式:游乐场名字_应用ID
五、AI原生应用与AppBuilder开发工具
细心的同学可以发现,全文贯穿的应用是什么?没错就是百度智能云千帆社区的AppBuilder。
要问啥是AppBuilder?顾名思义,就是“构建应用”的工具!在国内已经有200多个大模型的情况下,AI原生应用却还未爆发,主要原因是打造成熟的AI原生应用,在大模型之外,还需要应用原型、执行复杂任务的prompt、控制模型的幻觉、管理记忆等等,而千帆AppBuilder,都可以完成。
简单来说,如果AI原生应用是一间间“商品房”,AppBuilder就是准备好了“砖石材料”、“图纸”,甚至构建好了“样板间”的工具台,无论你想从0到1做小木屋、大别墅,还是想把样板间直接装修成歌剧院、咖啡厅,来这里都能加速他的实现。
目前官网上也上线了一些新的框架,比如官方发布的AI嘴替、桥牌计分器等等,大家都可以在AppBuilder体验。
点击立即体验,我们对原生开发的应用进行检验。
使用效果如下图所示:
AI大模型经过2023年的一次洗礼,已经真正实现了从1.0时代进入到了2.0时代的步伐,从学习大模型的基本使用到将大模型在实际的生产生活进行应用的过渡,毕竟再牛逼的技术如果没有实际的生产价值,没有“赚钱”的意义,都不会很长久的投资。
所以最关键的一点就是AI大模型进行落地,因此,AI大模型的原生应用将会是未来的巨大风口,我们要努力进行把握。
千帆杯第二期赛题【贺岁灵感模型】正在进行中,祝大家比赛取得满意的成绩,将10万奖金抱回家!新年快乐!
https://cloud.baidu.com/qianfandev/topic/268516
另外,也欢迎大家去体验千帆AppBuilder,除了Agent框架,还有RAG、文本生成等成熟的框架,搜索【百度智能云千帆AppBuilder】,或者点击阅读原文,跳转官网即可。
https://cloud.baidu.com/product/AppBuilder
最后,给大家做个预告,4月16-17日,百度Create AI开发者大会将在深圳举办,将汇聚来自世界各地的近万名顶尖开发者、科技大咖,听说当天还有30多节技术公开课,由多位百度主任架构师手把手教你搭AI应用,其中就包括如何玩转千帆Agent智能体,提前期待一下。