CV学习笔记
文章平均质量分 54
方方爱学习
计算机研究生在读
展开
-
YOLO系列学习——V4
Yolo V4:改进之处:集百家之所长,很多细节之处BOF:只增加了训练成本,将数据进行处理,但是测试是正常的测试,如:调整图像的对比度、亮度、旋转等等1.马赛克的数据增强(Mosaic data augmentation)Dropblock:之前的dropout是随机的杀死一些选择点,现在的dropblock是吃掉一个区域,增加难度标签平滑(label Smoothing):神经网络最大的缺点:过拟合比如让原来的标签【0,1】变成【0.05,0.95】使用之后,会使得之后的效果:族内更加紧密,族间更加分离原创 2023-12-21 21:26:16 · 482 阅读 · 0 评论 -
YOLO系列学习——V3
通过多scale来进行对大小物体的检测,将检测框分为3个分类,通过不同的感受野来进行划分,感受野越大的特征图就更加容易去检测更大的物体,随着网络的不断加深,越深层的卷积所生成的特征图,所对应的感受野也就也大,为之分配更加大的检测框,而在中间过程中所产生的特整体,其感受野也就小一些,可以用来检测小一点的,使用小的检测框。先验框更加丰富,3种scale,每种有3个规格,一共9种(V1-2种:横框和竖框,v2-5种:经过聚类的划分,V3-9种)特点:特征做得更仔细了,融入多持续特征图信息来预测不同的规格物体。原创 2023-12-21 20:54:22 · 364 阅读 · 0 评论 -
yolo入门:使用Yolov7来检测自己的图片detect.py(以及进行简单的修改,不使用命令行来运行)
Yolov7的速度以快出名,目前处于入门状态的小伙伴儿,可以先试着跑起来,但是对于去训练周期太长了,我在学习中,发现项目工程的里边放入自己的照片,运行来进行目标检测,我使用的权重参数是项目默认的那一个yolov7.pt这里边的默认是default='yolov7.pt',使用别的在这儿更改就好由于在项目的readme中所说明的运行detect.py的方法使利用命令行的形式,每次都要进行传参,我们在初始阶段很多参数不需要去更改,所以让其默认就好,我们将deteced.py的代码做简单的修改,代码附在最后。原创 2023-12-08 16:32:42 · 2794 阅读 · 5 评论 -
YOLOv7 main文件代码分享
yolov7从github上下载了代码,下载非常慢,并且下载下来出现文件夹错误,经过修复加压后,里边的文件依然少东西,少了utils文件夹,并且这个项目运行需要参数权重,下载也很慢,我搜集全了,供大家一起学习,网盘分享,里边已经把main代码和所有的权重都下载了。需要的自取,有问题留言!原创 2023-12-03 19:27:46 · 410 阅读 · 2 评论 -
使用GPU训练小型网络,以训练CIFAR10数据集为例
使用GPU训练网络,修改箱型部分即可,GPU不可用的解决方法,GPU是否可以的验证原创 2023-11-23 16:06:13 · 73 阅读 · 0 评论 -
消融实验的目的
消融实验就是通过出去模型的某一模块或者是功能,然后与原来的模型进行比较运行结果,即削弱系统的某个组件后使其继续正常运行原创 2023-11-18 19:28:32 · 328 阅读 · 1 评论 -
计算机视觉研究生入门心得
该文提出了一种多模态面部表情识别方法,利用音频信息和面部图像来提供区分一些模糊面部表情的重要线索。具体来说,就是引入了一个模态融合模块(MFM)来融合音频与视觉信息,其中图像和音频特征是使用Swin Transformer提取的。实验结果表明,该方法在AU检测任务上取得了较好的性能。模态融合模块(MFM),原意思是Multi Fusion Module ,在文中的解释是因为在脸部识别时,会存在图片不清晰的状况,通过脸部图像和声音的结合模式,判断声音的语速、音调以及大小,来多模式的融合识别面部,提高准确度。原创 2023-11-18 18:49:20 · 96 阅读 · 1 评论