darknet-yolov3学习笔记

最新推荐文章于 2021-05-25 12:50:25 发布

CV干饭王

最新推荐文章于 2021-05-25 12:50:25 发布

阅读量113

点赞数 1

分类专栏： darknet 文章标签：计算机视觉

本文链接：https://blog.csdn.net/weixin_44414948/article/details/109538154

版权

3 篇文章 1 订阅

订阅专栏

416416输入，5次下采样，输出三种尺度（8倍采样：5252，16倍采样：2626，32倍采样：1313）。
聚类得到三种尺度的共9个anchor box，1313：（(116 ,90); (156 ,198); (373 ,326)，大目标检测），2626：（(30,61); (62,45); (59,119)，中目标检测），56*56：（(10,13); (16,30); (33,23)，小目标检测）。
每个cell预测anchor box的三个框，416416输入时输出（5252+2626+1313）*3=10647个proposal box。
训练过程中采用设置阀值的IoU（交并比）评估预测值与真实值的偏差，从而训练输出各proposal box的置信度，根据各置信度通过非极大抑制（NMS）机制，设置阀值，预测模型置信度为极大值的目标框（多个）。
可以通过kmeans聚类自己数据集的anchor box，然后按照FPN的结构修改cfg文件下的anchors参数。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注