计算机视觉
文章平均质量分 77
总结常见的视觉算法模型
RessCris
怕什么真理无穷,进一寸有一寸的欢喜
展开
-
coco_eval 使用
coco 的评估函数对应的是 pycocotools 中的 cocoeval.py 文件。从整体上来看,整个 COCOeval 类的框架如图:基础的用法为cocoGt, cocoDt 应该是什么格式?如果是COCO 格式,注意需要增加 score 值。(how?原创 2024-07-10 15:19:58 · 986 阅读 · 0 评论 -
关于 matplotlib 显示灰度图片为绿调的问题
是因为 imshow 本身是一般需要传入 RGB 的图片,如果传入的二维的数据,但是 cmap 默认是viridis,就出现了 绿调。可通过调整 cmap=‘gray’ 解决。原创 2024-07-10 15:15:57 · 81 阅读 · 0 评论 -
YOLOv6 学习笔记
yolov6 出来的时候 yolov7 已经出了。原创 2024-02-18 23:48:06 · 1031 阅读 · 0 评论 -
YOLOv5 学习记录
为了读者更方便地搭建 CSPDarkNet53,笔者这里也给出 CSPDarkNet53 的结构图,如图所示,这里CSPDarkNet53依然使用的是类似 ResNet 的层次结构设计的思想,以及这里CSPDarkNet53对于每个 Stage的配置同DarkNet53一样,分别是 3,6,9,3,依次对应的下采样倍数为:4、8、16、32。相比较 YOLOv3 和 YOLOv4 匹配正样本的方式,YOLOv5的这种匹配方式能够分配更多的正样本,有助于训练加速收敛,以及正负样本的平衡。原创 2023-11-19 22:43:27 · 366 阅读 · 0 评论 -
智能驾驶汽车虚拟仿真视频数据理解(一)
五个样例,甚至30个测试样本也可以用来自己标注。滴滴?原创 2023-11-18 04:28:02 · 458 阅读 · 0 评论 -
YOLOv4 学习记录
FPN+PAN 借鉴的是PANet,当时主要应用于图像分割领域,如图所示,FPN 是自顶向下,将高层的强语义特征传递下来,而 FPN+PAN 针对这一点,在 FPN 的后面添加一个自底向上的金字塔,这样的操作是对 FPN 的补充,将底层的强定位特征传递上去,这也YOLOv4的Neck不仅能增强高级语义信息,又能增强特征的定位信息。问题1:即情况1的情况,当预测框和目标框不相交时,IOU=0,无法反应两个框距离的远近,此时损失函数不可导,IOU_Loss无法优化两个框不相交的情况。原创 2023-11-16 16:52:25 · 413 阅读 · 0 评论 -
YOLOv3 学习记录
关注目标在哪里目标是什么目标检测的发展路径:proposal 两阶段 --> anchor-base/ anchor-free --> nms free小目标、跨域?1、YOLOv3在实时性和精确性在当时都是做的比较好的,并在工业界得到了广泛应用。2、YOLOv3在Backbone网络结构上应用残差连接思想来解决深度网络的梯度消失问题。yolov2 使用的是 darknet 19, 类似于 vgg。3、YOLOv3最显著的改进就是在3个尺度上以相同的方式进行目标的检测。原创 2023-11-16 15:55:08 · 377 阅读 · 0 评论 -
MMDetection 系列(一): 初步入门配置文件
学习配置文件。原创 2023-11-04 16:38:56 · 236 阅读 · 0 评论 -
COCO 格式
id: 类别的唯一ID。name: 类别的名称。supercategory: 为了方便,相关的类别可以分组到同一个超类别。licenses (如果有的话): 列表,定义图像的许可证信息。原创 2023-11-02 16:21:35 · 377 阅读 · 0 评论 -
COCO showAnns 显示为空图
showAnns 不能单独调用,要先画一个相应的原图,再调用。参考下面的例子,需要先 plt.imshow(I) 之后才行。原创 2023-03-24 20:38:40 · 208 阅读 · 0 评论 -
将 mask 转换为 bbox
用一个test mask 测试并可视化结果, 可以发现,这个方法在处理有overlapping 的区域时不能划分。原创 2023-03-22 19:56:14 · 345 阅读 · 0 评论 -
目标检测评估指标 mAP, FPS
表示在不同IoU阈值(从0.5到0.95,步长0.05)(0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.95)上的平均mAP。等等指的是取detector的IoU阈值大于0.5,大于0.6,大于0.7。数值越高,即阈值越大,精度越低。第一个 mean, 表达的是针对不同任务,可能是all categories 的平均,也可能是 all IoU threshold 的平均…而 AP 中的average,指的是不同 recall 对应的最大精度。原创 2023-03-15 22:31:58 · 3097 阅读 · 0 评论 -
anchor_size, aspect_ratio, anchors以及torchvision 中 AnchorGenerator 解读
在一些目标检测的算法中,常常会看到关于如何生成 anchors 的描述,涉及到多尺寸目标检测的时候,就需要有不同大小的anchors作为proposal。转换后的 width_b, height_b 满足以下关系。原创 2023-02-13 14:43:24 · 484 阅读 · 0 评论