pytorch写FCN进行手提包的图像分割，有数据集

最新推荐文章于 2024-04-04 09:36:23 发布

datayx

最新推荐文章于 2024-04-04 09:36:23 发布

阅读量1.1k

点赞数

文章标签：图像识别机器学习人工智能深度学习计算机视觉

原文链接：https://loveai.tech/

版权

向AI转型的程序员都关注了这个号????????????

人工智能大数据与深度学习公众号：datayx

一，手提包数据集

数据集下载：用pytorch写FCN进行手提包的语义分割。

training

https://github.com/yunlongdong/FCN-pytorch-easiest/tree/master/last

放到bag_data文件夹下

ground-truth label

https://github.com/yunlongdong/FCN-pytorch-easiest/tree/master/last_msk

放到bag_data_mask文件夹下

项目目录结构：

训练数据：

训练label：

从这个手提包数据集可以看出，这是个二分类的，就是只分割出手提包和背景两个类别。所以label处黑色的表示手提包，白色的就是无关的背景。

二，训练代码（用来读取数据集，包括手提包图片和手提包图片的label）

代码获取方式：

分享本文到朋友圈

关注微信公众号 datayx 然后回复手提包即可获取。

AI项目体验地址 https://loveai.tech

店铺地址：

https://shop585613237.taobao.com

↓

2.1：数据集读取的代码

贴了数据集读取的代码后，我觉得有必要说一下onehot这个函数。

1.就是数据集label的onehot化：

onehot化是把label化成一个一维向量。

onehot化的函数如下：

输入的data为以灰度图形式读取的label，n为分割的类别数(此数据集是2)

buf = np.zeros(data.shape + (n, ))

#设data的shape为(a,b)，则构造一个全0矩阵，维度为(a,b,n)

因为n是2，所以意思就是，2层的(a，b)的全0矩阵，一层用来表示手提包的，剩下一层则是用来表示背景的。

nmsk = np.arange(data.size)*n + data.ravel()

这行则比较妙一点，首先设data的size为5，则arange(5)为，(0，1，2，3，4)，其实就是表示data各个元素的位置。arange(5)*2为(0，2，4，6，8)，其实这是变相表示原来长度x2的位置。而data因为是label，且归一化过的，所以data里的值要么是0要么是1，data.ravel()是把data展成一维数组，arange(5)*2+data.ravel()意思是在(0，2，4，6，8)中，表示手提包的则+1，表示背景的则+0。这里打个比方，例如第三个和第五个位置是表示手提包的，则是(0，2，5，6，9)，到这里可能还看不出什么，结合下一句代码就明白了。

buf.ravel()[nmsk-1] = 1

用回刚刚的例子(0，2，5，6，9)，nmsk-1后，是(9，1，4，5，8)，与初始的(0，2，4，6，8)对比，若原来是1的位置会保持原样(因为+1后又-1了)，而原本是0的，表示其位置就会-1。这样的结果就是把(a,b)的label投射到(a,b)*2的长度中。这样做的原因数据集是2分类的，所以网络输出肯定是(a,b,2)这样的，所以label必须要和网络输出维度形式一样才能比较，得出损失函数。

2.2，模型代码

三，效果展示

使用visdom可视化，运行了20个epoch后的可视化如下图：

机器学习算法AI大数据技术

搜索公众号添加： datanlp

长按图片，识别二维码

阅读过本文的人还看了以下文章：

TensorFlow 2.0深度学习案例实战

基于40万表格数据集TableBank，用MaskRCNN做表格检测

《基于深度学习的自然语言处理》中/英PDF

Deep Learning 中文版初版-周志华团队

【全套视频课】最全的目标检测算法系列讲解，通俗易懂！

《美团机器学习实践》_美团算法团队.pdf

《深度学习入门：基于Python的理论与实现》高清中文PDF+源码

特征提取与图像处理(第二版).pdf

python就业班学习视频，从入门到实战项目

2019最新《PyTorch自然语言处理》英、中文版PDF+源码

《21个项目玩转深度学习：基于TensorFlow的实践详解》完整版PDF+附书代码

《深度学习之pytorch》pdf+附书源码

PyTorch深度学习快速实战入门《pytorch-handbook》

【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》

《Python数据分析与挖掘实战》PDF+完整源码

汽车行业完整知识图谱项目实战视频(全23课)

李沐大神开源《动手学深度学习》，加州伯克利深度学习（2019春）教材

笔记、代码清晰易懂！李航《统计学习方法》最新资源全套！

《神经网络与深度学习》最新2018版中英PDF+源码

将机器学习模型部署为REST API

FashionAI服装属性标签图像识别Top1-5方案分享

重要开源！CNN-RNN-CTC 实现手写汉字识别

yolo3 检测出图像中的不规则汉字

同样是机器学习算法工程师，你的面试为什么过不了？

前海征信大数据算法：风险概率预测

【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目，让你掌握深度学习图像分类

VGG16迁移学习，实现医学图像识别分类工程项目

特征工程(一)

特征工程(二) :文本数据的展开、过滤和分块

特征工程(三):特征缩放,从词袋到 TF-IDF

特征工程(四): 类别特征

特征工程(五): PCA 降维

特征工程(六): 非线性特征提取和模型堆叠

特征工程(七)：图像特征提取和深度学习

如何利用全新的决策树集成级联结构gcForest做特征工程并打分？

Machine Learning Yearning 中文翻译稿

蚂蚁金服2018秋招-算法工程师（共四面）通过

全球AI挑战-场景分类的比赛源码(多模型融合)

斯坦福CS230官方指南：CNN、RNN及使用技巧速查（打印收藏）

python+flask搭建CNN在线识别手写中文网站

中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程

不断更新资源

深度学习、机器学习、数据分析、python

搜索公众号添加： datayx

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

datayx CSDN认证博客专家 CSDN认证企业博客

码龄13年

56: 原创

2万+: 周排名

3586: 总排名

200万+: 访问

: 等级

1万+: 积分

1537: 粉丝

1189: 获赞

401: 评论

1万+: 收藏

私信

关注

热门文章

最新评论

yolo5纸张卡片顶点检测，实现任意倾斜角度较正
GMC324: 大佬求数据集
评论赠书 | 关于信息流推荐算法，来自大厂专家的全面总结
杀戮苍生: 非常喜欢这篇博客！博主的写作风格简洁明了，让人一目了然。文章内容丰富，涵盖了很多实用的知识点，对我来说非常有帮助。尤其是博主在文章中提供了很多实际操作的步骤和技巧，让我能够更好地应用所学的知识。同时，博主的配图也很精美，更加生动地展示了文章中的内容。总之，非常感谢博主的分享，期待博主能够继续输出这样优质的好文。
评论赠书 | 关于信息流推荐算法，来自大厂专家的全面总结
埋雷炸弹人: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，期待博主持续带来更多好文。优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，期待博主持续带来更多好文
真实教育场景手写/表格/公式OCR数据集
柳折遥~: 请问数据集可以发给我吗，谢谢
IQA图像质量评价数据集介绍(LIVE、TID2013、CSIQ、LIVEC、KonIQ-10K)
哈哈哈MSE: 你好，你分享的链接全部过期了哦能再重新传一下吗

最新文章

2024

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。