【面试经验】九月份腾讯混元应用组实习一面

litterfinger

于 2024-09-13 23:03:39 发布

阅读量107

点赞数 1

文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/litterfinger/article/details/142235844

版权

介绍一下风格迁移论文做法
如何对风格和内容做解纠缠（instantstyle）
但是现在都是clip倒数第二层，clip只在倒数第一层做了文图对齐，你会怎么进行解纠缠/对齐（取很多相似的图像做few-shot的IPA平均，这样子当个数够多时候他们的平均就只代表风格，淡化内容；做风格风格话图像内容图像三元组显示训练）现在想想对齐也可以拿QK得到attention map Q是text K是图像
现在基于dit的架构很少有这样子的探索，如果是你的话你会怎么做？（现在想想应该采用B-LORA的思路去探索）
想要语义风格迁移，比如对应帽子对应裙子该怎么做？（无他 attention就是语义相似性）
风格是怎么定义的？（gram矩阵均值方差）
换另外一个面试官问虚拟试衣的做法，我负责的改进，有没有show case
针对复杂背景虚拟试衣怎么做？你这个项目是最重要上线吗？现在的inpainting虚拟试衣文本控制能力会很弱，有没有更好的想法让可以做到文本编辑还可以试衣（大意了，应该讲一下cvpr2024谷歌的instructimagen这种工作）
文生图可控生成的能力会不会下降，（会有一点，可图做的还是不错的）
介绍一下美团做的项目，k-means怎么选质心？为什么不用dbscan或者hdbscan？（我把这个忘了得想想后面肯定还问）k-means聚类也不见得效果就好
生成式检索和判别式的区别
怎么之前都在做多模态和agic跑去做nlp了？
coding： 1262 可被三整除的最大和（我写的只过了样例，唉这题看答案就很难）
能不能提前实习，介绍了一下业务，做ipa插件应用（感觉得补补ipa最近的工作）