😄 整个流程按如下问题展开,用时60min左右,偏小视频的cv,nlp,多模态方向,问项目,问实际应用问题,一道coding困难题(力扣原题)。
文章目录
- 1、自我介绍
- 2、介绍项目多模态小视频分类
- 3、clip的结构?clip的损失函数是怎样的?
- 4、为什么没用clip预训练?针对视频方面的clip有无了解?
- 5、有无了解对比学习的一些方法?(问了一个对比学习的损失问我知不知道,没听过忘了叫啥)
- 6、有无了解目标检测?对于小目标样本的检测应该如何做?
- 7、有无了解DP和DDP的原理?
- 8、transformer的自注意力机制解释?
- 9、LN和BN的区别?
- 10、trm的encoder和decoder区别
- 11、实际场景问题1:比如现在我们想在视频里识别出视频里在卖的商品,然后在构建好的商品库中推荐一些同款商品,说下你的解决思路。【注:视频里可能有多种物品,要判断出哪个是在卖的物品。】
- 12、实际场景问题2:针对ppt幻灯片类的视频帧的特征提取,有什么针对性的改价、优化方法吗?
- 13、多线程与多进程的区别?
- 14、Coding题(二叉树中的最大路径和),力扣上难度(困难):