FasterRCNN训练自己的数据集log1

最新推荐文章于 2024-05-06 15:44:10 发布

爱吃糖的小北

最新推荐文章于 2024-05-06 15:44:10 发布

阅读量720

点赞数

文章标签：新手上路

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42730997/article/details/88967266

版权

FasterRCNN 训练自己的数据集

这学期接手了一个project，关于宫颈癌前期筛查，我的任务是训练网络识别细胞切片里的细菌和微生物。
学长给我的是fasterRCNN的代码。
那么我的任务本质就是用fasterRCNN在我自己的数据集上训练，已达到识别的目的。

数据预处理

代码里有学长写好的自己的数据类型训练方法，输入图片是1024*1024，原先是用来进行多label的识别。

我拿到的数据也是多label的，那首先要把dirty的数据变得‘单纯’。

先从4.+G的图片数据内提取出文件名含‘fungi’的，发现有400+M。

由于一个样本特别大，所以分成了多个2048*3072的图片（称为视野图），只要这些视野图里有一个有医生标注的fungi，则整个样本都命名为fungi。

所以，还要将那些确实有fungi label的视野图找出来，用python.xml.etree.ElementTree库可以实现。

最后将图片crop成1024*1024的，并生成相应的XML文件。

然后出现了最大的问题。

问题！

最后的有用数据只有 80 多个。。。。
从4G+的原始数据里只有4M的有用数据。。。

还是试着训练了几下，调了点参数，出来几个model，训练时的loss感觉还好，在1.+~2.+之间，于是再demo。

出大事了。

所有的model对不同的图片输出都是固定的。。。

对一张全黑的空白图片demo的结果

?就是这样。

后来又搞了一批数据，同上处理了一波，数据量加大到200+（?）

训练、demo–>还是固定输出。

现在僵在数据量这里了，有突破了再更。

关于fasterRCNN

有几篇blog写的都不错。
贴下：
http://www.telesens.co/2018/03/11/object-detection-and-classification-using-r-cnns/

知乎上还有一篇，写的不错。

爱吃糖的小北

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
FasterRCNN训练自己的数据集log1

FasterRCNN 训练自己的数据集这学期接手了一个project，关于宫颈癌前期筛查，我的任务是训练网络识别细胞切片里的细菌和微生物。学长给我的是fasterRCNN的代码。那么我的任务本质就是用fasterRCNN在我自己的数据集上训练，已达到识别的目的。数据预处理代码里有学长写好的自己的数据类型训练方法，输入图片是1024*1024，原先是用来进行多label的识别。我拿到的数...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。