基于 Pytorch 的鞋子标签自动标注[译]

本文介绍了基于Pytorch构建的多标签分类模型,用于自动为鞋子图片标注颜色、风格等标签。通过拆分问题,训练3个ResNet18模型分别处理颜色、风格和混合特征,提高模型预测准确性。在小规模数据集上,每个模型预测速度约为0.43s,但在非白色背景或复杂场景下,模型效果受限,可能需要结合语义分割技术改善。
摘要由CSDN通过智能技术生成

原文:基于 Pytorch 的鞋子标签自动标注[译] - AIUAI

原文:Meta Tagging Shoes with Pytorch CNNs

Github - Generating-Tags

涉及的问题是对文本生成描述文本(generating text to describe images).

可行的解决方案有两种:

[1] - 采用 CNNs 进行特征提取,然后将提取的特征送入 LSTM,以生成最终的描述文本.

[2] - 构建 multi-label 分类模型,输出的每个节点(node) 分别对应特定的标签(tag).

第一种方案对于生成具有语法结构(grammatical structure) 的图像描述比较有优势.

第二种方案的多标签分类模型用于对于有限个标签(tags) 的生成与标注. 标签的数量可以足够大,只要有模型训练数据.

由于目的是,只采用图像作为输入,生成鞋子的标签标注,故这里采用 Multi-label 分类模型.

不采用 CNN+LSTM 的原因是,第一,这里不需要 English 等的语法结构(这是 LSTM 的作用);第二,需要更多的手工标注数据.

希望的是,采用预训练的网络模型&#

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值