ushop 是一款非常好用的软件, 使用收集箱收集的商品中,很多是带电商logo的,比如要把从shoppe(虾皮) 上面抓取的商品信息, 上架到Tiktok店铺上.
但是有很多商品的图片要求不符合要求,比如下面几种
- 带泰元符号的
包含泰元符号
2.带泰元价格符号的
3.带各种联系方式的
电话号码
从上面的图片种类来看, 泰元钱币符号分为三种, logo 比较简单, 基本上一种样式, 只是颜色的不一样, 联系方式多种多样, 单独比较大
解决方案分析,
第一步,使用按键精灵或者爬虫方式抓取图片, 进行分析
第二步, 使用图像识别机器学习的方法进行logo, 泰元/人民币/美元钱币符号, 电话/微信/LINE 等联系方式, 进行图像识别, 自动审图
第三步, 使用按键精灵方式或者其他脚本的方式进行自动移除商品工作.
最后总结效果达到95%左右的识别率, 可以达到无人值守进行商品看图, 清洗/移除问题商品, 有兴趣一起研究的,可以私信我QQ, 号码70571382. 目前的速度可以做到 1秒一个商品左右吧.
训练的数据集有上千张, 该项目的难点,我认为有两点, 一是如何从ushop上面获取商品信息, 另一个是训练模型, 种类太多, 我采用的是蒸馏的方法进行压缩, 不然速度太慢了.