面了美团大模型算法岗,被疯狂拷打。。。

最近这一两周不少公司已开启春招。

不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。

最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。

总结如下:

《大模型面试宝典》(2025版) 发布!

喜欢本文记得收藏、关注、点赞

大家好,最近面了美团大模型算法岗(日常实习),bg一般,之前有一段还可以的实习。

面试官挺好的,让人觉得体验感非常好。面试题都能说一点,但是感觉语言表达能力稀烂,感觉凉了。

面试题分享,欢迎交流学习

面试题

  1. 请阐述您的研究方向(简历中未提及),如果研究方向为 AI4science,能否介绍一下如何通过对比学习实现多模态对齐,以及涉及的数据形式。
  2. 详细介绍您第一个项目的流程。
  3. 在项目中运用 RAG 时,遇到了哪些难题?
  4. 相较于微调,选择 RAG 的原因是什么?RAG 具有哪些优势,例如在应对灾难性遗忘、知识更新以及幻觉问题方面(此处可结合自身理解详细说明幻觉相关内容)?
  5. 项目中涉及 query 改写的模型训练,请问进行 query 改写的目的是什么?query 改写数据集的具体构成是怎样的?多轮对话的数据集流程是怎样的,如何判断是否需要通过多轮对话引导用户进一步描述问题?
  6. 对于 sft 数据集,您有哪些避免灾难性遗忘的处理方法?
  7. 我们的业务场景并不需要对 embedding 模型进行微调,而您的项目进行了微调,请问原因是什么?
  8. 请介绍 DPO,先介绍一下 PPO,然后探讨 reference 模型和 actor 模型是否可以为同一个模型。
  9. reference 模型在相关任务中起到什么作用?
  10. deepseek r1 采用 GRPO 的原因是什么?
  11. 请详细介绍 deepseek r1 的 GRPO。
  12. 为什么 GRPO 不需要 critic?
  13. deepseek r1 进行冷启动的目的和原因是什么?
  14. GRPO 去除了 critic,那么其奖励是如何计算的?
  15. PRM 和 ORM 各自的优势是什么?分别适用于哪些场景?在 kimi k1.5、deepseek r1 和 rstar math 等相关场景下,PRM 是否真的不适用?
  16. PRM 落地的核心要点是什么?
  17. 您对本次面试有什么疑问?
React Hooks 是 React 16.8 中新增的特性,它可以让你在函数组件中使用 state、生命周期钩子等 React 特性。使用 Hooks 可以让你写出更简洁、可复用且易于测试的代码。 React Hooks 提供了一系列的 Hook 函数,包括 useState、useEffect、useContext、useReducer、useCallback、useMemo、useRef、useImperativeHandle、useLayoutEffect 和 useDebugValue。每个 Hook 都有特定的用途,可以帮助你处理不同的问题。 下面是 React Hooks 的一些常用 Hook 函数: 1. useState useState 是最常用的 Hook 之一,它可以让你在函数组件中使用 state。useState 接受一个初始状态值,并返回一个数组,数组的第一个值是当前 state 值,第二个值是更新 state 值的函数。 ``` const [count, setCount] = useState(0); ``` 2. useEffect useEffect 可以让你在组件渲染后执行一些副作用操作,比如订阅事件、异步请求数据等。useEffect 接受两个参数,第一个参数是一个回调函数,第二个参数是一个数组,用于控制 useEffect 的执行时机。 ``` useEffect(() => { // 这里可以执行副作用操作 }, [dependencies]); ``` 3. useContext useContext 可以让你在组件树中获取 context 的值。它接受一个 context 对象,并返回该 context 的当前值。 ``` const value = useContext(MyContext); ``` 4. useRef useRef 可以让你在组件之间共享一个可变的引用。它返回一个对象,该对象的 current 属性可以存储任何值,并在组件的生命周期中保持不变。 ``` const ref = useRef(initialValue); ref.current = value; ``` 5. useCallback useCallback 可以让你缓存一个函数,以避免在每次渲染时都创建一个新的函数实例。它接受一个回调函数和一个依赖数组,并返回一个 memoized 的回调函数。 ``` const memoizedCallback = useCallback(() => { // 这里是回调函数的逻辑 }, [dependencies]); ``` 6. useMemo useMemo 可以让你缓存一个计算结果,以避免在每次渲染时都重新计算。它接受一个计算函数和一个依赖数组,并返回一个 memoized 的计算结果。 ``` const memoizedValue = useMemo(() => computeExpensiveValue(a, b), [a, b]); ``` 以上就是 React Hooks 的一些常用 Hook 函数,它们可以帮助你更好地处理组件状态、副作用、上下文和性能优化等问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值