面完 AIGC 大模型算法岗,心态崩了。。。

大家好,今天我们继续聊聊 AI 科技圈发生的那些事。

内容包括:AI 科技圈最新动态和最新面试题总结。

Meta 推新一代 SAM 2

图像识别再进化!Meta 推新一代SAM 2

官方链接:https://ai.meta.com/blog/segment-anything-2/

SAM 2 可应用于各种现实世界的用例。它支持在任何视频帧中选择和细化对象

例如,跟踪对象以创建视频效果(左)或分割从显微镜捕获的视频中的移动细胞以帮助科学研究

SAM 2 特点总结如下:

  • 具有快速精准的对象分割能力,可在静态图像和动态视频中轻松应对。

  • 实时追踪对象的能力使其在视频编辑和互动媒体内容制作领域具有广泛应用前景。

  • 具有零样本泛化能力,能准确识别和分割未经训练的对象或场景。

EchoMimic

前段时间,建国和老拜同志对唱的视频比较火,今天分享一个类似的开源项目。

EchoMimic,不仅能够单独通过音频和面部标志生成人像视频,还能够通过音频和选定的面部标志相结合来生成肖像视频。官方地址:https://badtobest.github.io/echomimic.html

EchoMimic 已在各种公共数据集和我们收集的数据集上与替代算法进行了全面比较,显示出在定量和定性评估方面的卓越性能,其他可视化和源代码访问可以位于 EchoMimic 项目页面上。

案例

AIGC 高频面试题

最近 AIGC 相关的面试题猛增,特别是爆火的LLM、多模态、扩散模型等考察的知识点越来越多。

有球友跟我反馈,上周面试了 AIGC 岗位,差点崩溃。

在这里我特别整理了一些代表性面试题,下图中的题目,你会几题?!

Diffusion

  1. 常见的采样方式以及原理?

  2. 扩散模型中添加的是高斯噪声,能否使用其他噪音的加噪方式?

  3. 如何加速Diffusion?

  4. DDPM和DDIM的关系?推演DDPM公式。

  5. GAN和Diffusion的区别?

  6. 训练Stable Diffusion时为什么要使用offset Noise?

  7. 介绍一下classifier-free guidance和classifier guidance的区别?

  8. 实现DDPM是否需要什么条件?

  9. 为什么DDPM加噪声的幅度不是一致的?

AIGC 高频题

  1. 细致讲从 DALLE 1 如何发展到 DALLE 3,每个算法的核心原理,每次的创新是什么

  2. 介绍MoE和变体

  3. 介绍LoRA和变体

  4. 介绍CLIP的模型架构与损失函数。谈谈AE,VAE和VQ-VAE的区别。

  5. Stable Diffusion是如何训练的?

  6. 介绍一下最新版的 SD 和 Dall-E 两者的异同。

  7. 谈谈Stable Diffusion中的交叉注意力机制。

  8. 如何改善GAN的模式坍塌?

  9. 谈谈Lora/Dreambooth/Textual Inversion, 原理以及差异。

  10. 介绍一下CLIP的核心原理,模型怎么训练的?

  11. CLIP 有哪些变体?

  12. 谈谈CLIP编码特征的优点缺点。

(完)

  • 31
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值