CV算法工程师面试高频基础知识点

最新推荐文章于 2024-08-30 00:08:45 发布

Pencil_J

最新推荐文章于 2024-08-30 00:08:45 发布

阅读量1.4k

点赞数 24

文章标签：算法面试深度学习计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Pencilhj/article/details/134768209

版权

本文介绍了CV算法工程师面试中常见的基础知识点，包括过拟合与欠拟合的概念、抑制过拟合的方法（如L1/L2正则化、数据增强等）、BatchNorm层的作用以及学习率策略。还对比了BN、LN、IN、GN等归一化层的区别。

摘要由CSDN通过智能技术生成

写在前面：CV算法工程师面试时，除了考察项目经验和技术深度，基础知识点的提问也必不可少。这部分如果答不上来，面试印象会大打折扣，因此建议着重记忆。另外的【附加实战经验】部分为个人调参经验，供参考～

1. 什么是过拟合和欠拟合？

过拟合：模型在训练集表现好，测试集表现不好。一般是因为模型太大，或训练数据太少。

欠拟合：模型在训练集和测试集的表现都不好。一般是因为模型太小。

2. 抑制过拟合的方法

常见标准答案：

(1) L1/L2正则化。

(2) 数据增强：平移、旋转、翻转、随机裁剪等。

(3) Dropout：训练时神经元以概率p置0（推理时的计算方式：输入乘以1-p）。

(4) Early stopping：早停法，当模型在验证集上的表现下降的时候，停止训练。

附加实战经验：

(1) BatchNorm层冻结，否则小模型容易过拟合。

(2) 小batch size先训练。

(3) 减少可训练层的数目。

3. L1/L2正则化权重衰减

L1正则化: loss计算时加一项，参数的L1范数，各元素的绝对值之和。得到的参数会更加稀疏。

L2正则化： loss计算时加一项，参数的L2范数，各元素的平方和。使网络权重倾向于选择更小的值，这样不同特征对结果的影响相对均衡，不会受一些噪点影响，提升了泛化性。

附加实战经验：

(1) ResNet50衰减系数一般1e-4，移动端小网络如MobileNet一般1e-5。

(2) L2系数太大抑制过拟合，但可能会欠拟合，尤其对于小网络参数量不足的情况。

(3) 数据集小时，网络容易过拟合，这时L2系数可以适当调大。

4. 类别不均衡解决方法

(1) 重采样: 样本量少的类别使用重采样，样本量多的类别使用欠采样。

(2) 重加权：算loss时，样本量少的类别，loss权重大一些。

(3) 损失函数：使用focal loss，在交叉熵loss的基础上增加动态调整因子，把易分样本的loss拉低，使网络更加关注难样本的分类

(4) 数据合成：使用AIGC合成样本，或者数据挖掘方法（爬虫获取无标签数据，使用训练好的模型预测得到伪标签）。

5. BatchNorm层

一种正则化技术，用来抑制过拟合。

训练时：假设输入tensor形状为[N, C, H, W]，则

(1) 在一个Channel内，对NHW做平均，得到均值维度[1, C, 1, 1]，同理计算方差；

(2) 输入tensor减均值，除以方差(加sigma防止除0)；

(3) 乘以可学习参数alpha加beta还原。

推理时：用训练过程中保存下来的滑动均值和滑动方差。

6. pool层

(1) 最大池化：正向：邻域取最大值作为输出，反向：最大位置是回传梯度，其它位置为0。

(2) 平均池化：正向：邻域算平均值作为输出，反向：均匀回传给输入位置。

7. 学习率策略

(1) 常用：piece wise分段式，常用方式；Cosine decay，无需调整超参，性能鲁棒，一般用这个收敛较为缓慢，轮数要多一些。

(2) 学习率和batch_size要按线性比例调整。

(3) 初始学习率一般跟数据集有关。

8. BN、LN、IN、GN的区别

假设输入tensor的形状为[N, C, H, W]，对应batch_size，通道数，高度，宽度。

(1) BN 批归一化：计算均值和标准差时，在一个channel内，对HW和Batch做平均，均值维度[1, C, 1, 1]。CNN常用，batch size小的时候，效果可能不太好。

(2) LN 层归一化：计算均值和标准差时，在一个batch内，对HW和Channel做平均，均值维度[B, 1, 1, 1]。RNN或transformer用。

(3) IN 实例归一化：算均值和标准差时，同时固定channel和batch，对HW做平均，均值维度[B, C, 1, 1]。图像风格迁移任务用，结果依赖于某一个实例。

(4) GN 组归一化：计算均值和标准差时，固定batch且对channel做分组，分组内对HW做平均，[B, C/g, 1, 1]。

关注

24
点赞
踩
29

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Pencil_J CSDN认证博客专家 CSDN认证企业博客

码龄1年

9: 原创

138万+: 周排名

18万+: 总排名

7962: 访问

: 等级

235: 积分

115: 粉丝

145: 获赞

3: 评论

159: 收藏

私信

关注

热门文章

最新评论

SORA技术报告
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
论文阅读 | Smartbrush: Text and shape guided object inpainting with diffusion model
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读 | Uni-paint:A Unified Framework for Multimodal Image Inpainting with Pretrained Diffusion Model
CSDN-Ada助手: 恭喜您撰写了第6篇博客！标题《论文阅读 | Uni-paint:A Unified Framework for Multimodal Image Inpainting with Pretrained Diffusion Model》引人入胜。您对这一主题的深入分析和论述令人印象深刻。不仅详细介绍了Uni-paint的统一框架，还提及了使用预训练扩散模型进行多模态图像修复的方法。这样的研究对于我们理解多模态图像修复的挑战和方法具有重要意义。鉴于您对这一领域的深入了解，我很期待您在未来的创作中能够进一步探索Uni-paint框架的优势和局限性。也许您可以考虑介绍一些与该框架相关的实际应用案例，或者深入研究一些类似的预训练模型在其他领域的应用。这将为读者提供更多的见解和启发，并进一步促进学术界对这一领域的研究。再次恭喜您，并期待您未来更多博客的分享！
CV算法工程师面试高频基础知识点
CSDN-Ada助手: 恭喜你写了第四篇博客！看到你分享关于CV算法工程师面试的高频基础知识点，我感到非常兴奋。你的文章内容丰富，对读者来说是非常有益的。希望你能继续保持创作的热情，不断分享更多有价值的内容。下一步，我建议你可以深入研究一些实际案例，结合自己的经验和见解，为读者提供更多实用的建议和技巧。期待你更多的精彩作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
Inpainting方向2023顶会论文汇总
CSDN-Ada助手: 恭喜您在Inpainting方向取得了丰硕的成果，能够整理出2023顶会论文汇总，展现了您在这一领域的深厚造诣。希望您能够继续保持创作的热情和动力，不断深入研究，为该领域的发展贡献更多的智慧和力量。或许可以考虑在下一篇博客中分享一些关于Inpainting方向的研究趋势和未来发展方向，让更多的读者受益。期待您的精彩继续！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。