本系列视频来自百度工程效能部的前端研发经理杨经纬,她在由开源中国主办的“AI编程革新研发效能”OSC源创会·杭州站·105期线下沙龙活动上,从一款文心快码(Baidu Comate)前端工程师的角度,分享了关于智能研发工具本身的研发历程和理念。
👉点击观看关于【智能代码助手需要什么】的观点2完整视频。
经纬说:
那么下一个就是效果的方面,我们怎么样把这个给用户推出来的东西让它更精准?
那首先看下面,我们和文心团队一起打造了专属的代码大模型。这个里面一个是模型训练的部分,我们采用了监督学习,就是传统的 SFT 精调的训练。然后另外我们也进行了强化学习,这个指的是数据飞轮,我们去告诉我模型哪些是好的,哪些是不好的,用这样的数据飞轮的方式来持续地去强化模型的能力,给我们推荐更精准的代码。
另外就是数据工程的方向,首先我们提供了丰富的数据来源,我们在给用户推荐的各个环节里面都提供了比较精细化的这些能力,从发起请求一直到后处理,在发起请求这块我们提供了动态的延迟触发,就是我们在推荐的时候都有一个debug,这个大家应该都比较了解,那我们采取了一个动态延迟触发,我们会去判断一下在什么情况下应该快一点给用户推荐,什么情况下慢一点推荐啊。
举个例子,比如说在控行的时候,这个时候用户明显的他就会想要我们给他推荐代码,那这个时候我们偏向于快一点的给他提供,那如果我们推荐了三次,用户都没有采纳,这个时候我们倾向于慢一点,就是类似的一系列的策略去实现了动态延迟触发。