【面试经验】九月份腾讯混元应用组实习一面

  1. 介绍一下风格迁移论文做法

  2. 如何对风格和内容做解纠缠(instantstyle)

  3. 但是现在都是clip倒数第二层,clip只在倒数第一层做了文图对齐,你会怎么进行解纠缠/对齐(取很多相似的图像做few-shot的IPA平均,这样子当个数够多时候他们的平均就只代表风格,淡化内容;做风格 风格话图像 内容图像三元组显示训练) 现在想想对齐也可以拿QK得到attention map Q是text K是图像

  4. 现在基于dit的架构很少有这样子的探索,如果是你的话你会怎么做?(现在想想应该采用B-LORA的思路去探索)

  5. 想要语义风格迁移,比如对应帽子 对应裙子该怎么做?(无他 attention就是语义相似性)

  6. 风格是怎么定义的?(gram矩阵 均值方差)

  7. 换另外一个面试官问虚拟试衣的做法,我负责的改进,有没有show case

  8. 针对复杂背景虚拟试衣怎么做? 你这个项目是最重要上线吗? 现在的inpainting虚拟试衣文本控制能力会很弱,有没有更好的想法让可以做到文本编辑还可以试衣(大意了,应该讲一下cvpr2024谷歌的instructimagen这种工作)

  9. 文生图可控生成的能力会不会下降,(会有一点,可图做的还是不错的)

  10. 介绍一下美团做的项目,k-means怎么选质心?为什么不用dbscan或者hdbscan? (我把这个忘了 得想想后面肯定还问)k-means聚类也不见得效果就好

  11. 生成式检索和判别式的区别

  12. 怎么之前都在做多模态和agic跑去做nlp了?

  13. coding: 1262 可被三整除的最大和(我写的只过了样例,唉 这题看答案就很难)

  14. 能不能提前实习,介绍了一下业务,做ipa插件应用(感觉得补补ipa最近的工作)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

litterfinger

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值