大模型面试经验(一)

文章讲述了作者面试时遇到的大模型实战项目问题,涉及RAG实现、强化学习的应用局限、以及电商中如何通过大模型改进推荐算法。面试官强调了算法选择的重要性,以及业务评估指标如hitrate、幻觉率等在大模型性能评价中的作用。
摘要由CSDN通过智能技术生成

哎,没做过大模型,投了一个面试先来踩踩坑吧。

面试的问题主要是集中在大模型实战项目部分。问了RAG怎么做,如果问到范围之外的问题该怎么办?我回答说有一个规则判断的方法,如果问到的问题不匹配提问的规则,那么就过滤掉。但是面试官后面的反问里说,业务上是先训练一个意图判断的接口,看看这个是属于哪个分类,然后调用相应的agent。这样就可以支持闲聊机器人了。我们做的实战项目还是太简单了。

项目里还写用到了强化学习,但是其实强化学习的用处不大。。这一点回顾简历的时候也发现了,所以算法工程师根据场景选择合适的算法是重要的,不要为了什么高大上的技术去搞一个新算法。

大模型在电商的应用场景主要是导购机器人,这里的问题是如果是连衣裙搭配,大模型怎么回答?不会继续推荐连衣裙了,而是会推荐和他相关的商品。疑问:如果是这样的效果,现在的推荐算法,猜你喜欢这种能不能做?

另外后面的提问里还问了他们业务上看中什么指标?主要是业务方会模拟1000个提问,会从hitrate、幻觉、拒答、安全等指标来评估这个RAG的性能。当然在上线任务也是有latency指标的,响应不能超过5s,2s必须有第一个token。

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值