电商图像分析服务是一款电商平台环境下的图像分析在线服务产品,该产品能为开发者和企业提供若干图像分析和理解技术的在线API服务,包括牛皮癣图像识别、图像背景分析、炒信图像识别等独立服务模块。
从原理上来看,这些独立服务模块使用了以下技术和手段:
- 牛皮癣图像识别:采用深度学习方法,判断商品主体之外有没有文字以及图片中有没有水印。这里牛皮癣的定义是非商品本身的图片中的文字、logo,以及后期PS在商品上的明显广告宣传语以及水印。算法会输出0~1的牛皮癣分值,分值越大那么表明其牛皮癣的概率越大。
- 白底图像检测:通过扫描图像四条边缘margin白色像素值的比例,再设计一些鲁棒的规则来判断图像是否为白底。
- 炒信图像识别:关于文字识别,样本是决定算法的关键。通常标记样本是最重要也是最耗时间的部分,电商图像分析团队使用一套自动生成各种字体和颜色样本的方法解决了样本多样性的问题。同时分别针对机打和花体等多种淘宝图片字体问题训练多模型的文字识别引擎,解决了淘宝图像中存在多样性文字的识别问题。
电商图像分析服务通过模式识别、机器学习技术来分析电商平台上的图像内容。不同分析技术可以适用于不同的电商业务场景,其中主要应用场景有:
- 图像资源的自动化审核:实时判断用户、商家上传的图像是否满足行业规范,可以做到实时拦截违规图像
- 选品和投放:电商平台大促期间的招商选品过程、各行业频道日常的选品投放过程中都需要对商品图像(主图、副图、SKU图像等)进行自定义的过滤、选优和排序
- 搜索推荐:商品图像的特征能丰富搜索和推荐的特征,对商品图像基础属性进行精准预测,是提高推荐和搜索的有效途径
- 广告图像和banner的CTR预估:从图像维度提取抽象与具象特征,可以有效地刻画图像和banner的质量和吸引力,与传统特征结合来提高CTR预估的准确率