基于 Pytorch 的鞋子标签自动标注[译]

最新推荐文章于 2023-09-17 21:52:56 发布

AIHGF

最新推荐文章于 2023-09-17 21:52:56 发布

阅读量1.4k

点赞数

分类专栏：图像分类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zziahgf/article/details/83590101

版权

本文介绍了基于Pytorch构建的多标签分类模型，用于自动为鞋子图片标注颜色、风格等标签。通过拆分问题，训练3个ResNet18模型分别处理颜色、风格和混合特征，提高模型预测准确性。在小规模数据集上，每个模型预测速度约为0.43s，但在非白色背景或复杂场景下，模型效果受限，可能需要结合语义分割技术改善。

摘要由CSDN通过智能技术生成

原文：基于 Pytorch 的鞋子标签自动标注[译] - AIUAI

原文：Meta Tagging Shoes with Pytorch CNNs

Github - Generating-Tags

涉及的问题是对文本生成描述文本(generating text to describe images).

可行的解决方案有两种：

[1] - 采用 CNNs 进行特征提取，然后将提取的特征送入 LSTM，以生成最终的描述文本.

[2] - 构建 multi-label 分类模型，输出的每个节点(node) 分别对应特定的标签(tag).

第一种方案对于生成具有语法结构(grammatical structure) 的图像描述比较有优势.

第二种方案的多标签分类模型用于对于有限个标签(tags) 的生成与标注. 标签的数量可以足够大，只要有模型训练数据.

由于目的是，只采用图像作为输入，生成鞋子的标签标注，故这里采用 Multi-label 分类模型.

不采用 CNN+LSTM 的原因是，第一，这里不需要 English 等的语法结构(这是 LSTM 的作用)；第二，需要更多的手工标注数据.

希望的是，采用预训练的网络模型&#

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。