浅谈淘宝类目属性体系:商品搜索背后的逻辑架构

[核心提示] 淘宝拥有百万家商户和超过10亿的商品数,它如何让用户精准地找到想要的商品呢?其背后有着强大的技术支撑。

淘宝目前在线商品数超过 10 亿,如何精准的帮助用户找到他想要的商品呢?经过多年的探索,淘宝通过建立一套完整的类目属性体系,终于较好的解决了这一问题,今天就跟大家一起来谈谈淘宝的类目属性体系。

一点点历史和架构

2003 年淘宝刚上线时,商品量很少,没有分类。 后来,商品量上百,开始有了对商品进行单级分类,有点类似于现在的一级行业类目。

等到商品上万的时候,商品的单级分类已经不能满足需求,开始有了多级分类,就是一颗类目树了。从 06 年开始引入了属性,商家按照属性模板填写属性,用户可以按照属性筛选商品。

到了 08 年,开始将前后台类目分开,用户根据前台类目筛选商品,商家将商品挂到后台类目上,前后台类目树之间建立好映射。

今天的淘宝类目属性体系主要由后台类目树、前台类目树、挂载在后来叶子类目上的商品属性模板以及管理前后台类目之间映射关系的类目管理平台组成,整体架构如下:

 893af95260fc572c45710d7731bc6a3e

从图中可以看出,淘宝类目属性体系是一个非常基础的数据服务,在商品发布页上商家选择后台类目上传商品信息,详情页上以面包屑的方式给用户显示商品所属的前台类目,在搜索结果页上让用户根据前台类目筛选商品。运营同学可以通过一个管理后台来管理前后台类目之间的映射关系以及后台类目的属性模板。

后台类目

后台类目面向商家,主要用于商品的分类和属性管理。商家上传商品时见到的就是后台类目,如下图:

b57b23426d29552e78a6c45e57bd0d88

后台类目有如下特点:

  • 后台类目树中最重要的是叶子类目,也就是类目树上不能再往下分的类目,任何商品都必须挂载到后台叶子类目上。
  • 叶子类目挂载属性模版,商家发布商品时选择好类目之后会根据属性模版,补充必填的商品属性信息,方可成功上传商品。
  • 后台类目相对稳定,不能随便删除,叶子类目不能重复。

前台类目

前台分类面向用户,方便用户筛选查找商品,大部分时候用户见到的类目都是前台类目。下图就是淘宝搜索结果页上的淘宝前台类目树:

00febb125ec98ad1d1161cc5040cd230

前台类目有如下特点:

  • 用户购买时看到的类目是前台类目。
  • 前台类目通过跟后台映射间接和商品关联。
  • 前台类目由后台叶子类目+属性组成,一个前台类目可以包含多个后台类目,一个后台类目也可以映射给多个前台类目。
  • 前台类目不直接挂载属性模版,前台类目对应的属性来自后台叶子类目的公共属性。
  • 前台类目很灵活,可重叠,可删除。

为什么要将前后台类目分开呢?

介绍完淘宝的类目属性体系,或许你会问为啥要将前台类目和后台类目分开呢?直接用一套类目体系不就行了吗?这里我就给大家解释一下原因,到了 08 年,淘宝商品日益增多,类目层级也越来越深,买家越来越难找到想要的商品。淘宝的小二们就开始不断调整类目属性,把类目树变浅,让商品更容易被买家找到。只有一套类目体系的情况下,小二每次调整,卖家也必须跟着调整。如果只是改一次,卖家也能勉强接受,但这是周期性的。比如,在夏天服装这个类目下可能是连衣裙、衬衫等夏装,到了冬天就会变成打底裤、羽绒服等冬装了,而且卖家也都知道这些调整时合理的,但是一年到头这么调整,意味着他一年到头都在编辑类目,可能还得专门养个把人在那里,一天到晚改类目,无形中卖家的运营成本也就提高了。

08 年的时候,有个淘宝的产品经理从线下零售巨头沃尔玛得到启发,他发现沃尔玛仓库里面的类目分区和货架区的类目分区是分离的,仓库里面的类目分区比较稳定,很少变化,而货架区的类目分区会根据活动和季节经常调整。类似的,淘宝也可以把原来的一套类目体系分为后台分类和前台分类,后台分类面向商家,用来挂载商品和属性模板,比较稳定很少变化;前台分类面向用户,主要方便用户查找商品,很灵活,可以经常调整。后台类目和前台类目之间通过映射联系起来,一个后台类目可以映射到多个前台类目,一个前台类目也可以包含多个后台类目。

从技术的角度来看的话,前台类目就是在后台类目的基础上建立了一个虚拟类目。

类目属性体系在搜索上的应用

先来看看类目属性体系是怎么帮助提升搜索的精准度的,下图是说明了用户 query 到商品搜索结果的全过程:

2fd3b3a3c7207930bef0ac45e2944648

用户输入 query:iPhone,淘宝类目属性体系预测到跟这个 query 最相关的前台类目是手机,然后前台类目通过映射找到后台类目手机,最终在这个类目下找到了“iPhone 5s 土豪金”这个商品。

有了类目属性体系,用户搜索 iPhone,淘宝就不会给出手机套这样的配件了,因为它只会到手机类目下去找商品。

有了类目属性体系,用户可以直接在搜索结果页按照类目和属性筛选商品,更加高效的找到想要的商品。而淘宝搜索可以通过记录用户搜索 query 之后的类目属性筛选行为,精准预测每一个 query 的类目和属性意图,当用户再次搜索的时候,可以根据 query 的类目属性意图,在 query 文本相关性的基础上计算出商品的类目和属性相关性,把包含 query,且跟用户的类目和属性意图最相关的商品优先展示给用户。这也是百度这样的通用搜索引擎所做不到的,因为它没有类目属性体系。

有了类目属性体系,还可以做好搜索算法的垂直化优化。也就是在每一个细分类目下,可以采用不同的商家权重和品牌权重,甚至可以有不同的排序公式。比如用户选择手机时,更多考虑各项参数和评测文章,这个时候相应的排序权重因子可以加强,而选择服装的时候,一张漂亮的主图就无比重要了,排序因子里面主图质量的权重就需要提升了。 有了类目属性体系,还可以做基于类目和属性的个性化搜索。搜索引擎通过用户的类目属性筛选日志,可以挖掘出用户的一些特征,比如性别,意向价格区间,偏好品牌,偏好品类等,从而可以对这个用户做个性化的展示。

类目属性体系无处不在

除了电商,其实在各个需要帮助快速查找信息领域都可以见到类目属性体系的身影。比如:教育行业里面的课程分类,医疗行业的疾病和医院分类。当我们把用户查找的信息看做一个个实体的时候,对实体分类以帮助快速定位查找就是一个非常通用的方法。从这个角度来讲,Google 的 Knowledge Graph 可以看做是将电商网站里面的商品类目属性体系推广到了整个世界中的万事万物,它试图使用一套统一的类目属性网来囊括所有的实体,或许这就是通用搜索引擎的类目属性体系吧。

本文为作者葛灿辉(@葛灿辉-搜索数据挖掘)投稿发布,转载请注明出处并附带本文链接

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 淘宝商品的大类 id 类目数据是指在淘宝平台上各个商品类别的分类信息。淘宝平台上的商品类别非常广泛,涵盖了服装、家居、数码、美妆、食品、母婴等各个领域。 淘宝商品的大类 id 类目数据一般由淘宝平台自行维护,并以数字化的形式进行标识和管理。每个大类 id 都对应着一个具体的商品类目,例如服装类别的大类 id 可能为1,电器类别的大类 id 可能为2。 在每个大类 id 下,又会细分出多个小类,如服装类别下可能包括男装、女装、童装等多个小类别的商品。这样的分类体系能够帮助消费者更快速、准确地找到他们所需要的商品淘宝平台上的商品数据非常庞大,因此对于每个商品,都会有一个唯一的类目标识,以区分所属的具体类别。这样的类目数据可以用于搜索商品、展示商品、推荐商品等多个方面的应用。 淘宝商品的大类 id 类目数据对于商家来说也非常重要,商家需要根据具体的商品属性选择合适的类目进行上架销售。同时,这些类目数据也能够帮助商家更好地了解市场行情和竞争对手情况,为商家的运营决策提供参考。 ### 回答2: 淘宝商品的大类id类目数据是指淘宝平台上各个商品大类的标识和对应的类目数据。淘宝平台上的商品种类繁多,为了方便用户浏览和搜索淘宝商品按照不同的大类进行分类管理,并为每个大类分配一个唯一的标识符,即大类id。 淘宝商品大类包括服饰、手机数码、家电、美妆、母婴、食品、家居、运动户外、汽车、图书、虚拟商品等。 大类id类目数据是指每个商品大类对应的具体类目数据集合。具体来说,每个大类都会有一系列的细分类目,用于更精确地描述和归类商品。例如,服饰大类下的类目可以包括男装、女装、童装等;手机数码大类下的类目可以包括手机、电脑、相机等。 每个类目都有自己的类目id和类目名称,类目id是该类目淘宝平台上的唯一标识符,可以用于区分不同类目类目名称则是对该类目的简要描述,方便用户快速识别。 淘宝商品大类id类目数据的存在,使得用户能够更便捷地找到自己所需的商品。无论是在浏览页面还是进行搜索,用户可以根据自己的需求选择相应的大类和类目,从而缩小商品范围,提高购物效率。同时,对于卖家来说,也能更好地将自己的商品归类到相应的大类和类目下,增加曝光和销量机会。 ### 回答3: 淘宝商品大类id类目数据是指淘宝网站上各个商品分类的唯一标识和类目名称的数据。淘宝网站作为国内最大的电商平台之一,商品分类繁多,以满足不同消费者的需求。 淘宝商品大类id是淘宝系统对每个商品分类设置的唯一标识,通过这个标识可以在后台数据库中快速找到对应的类目数据。每个大类id对应一个具体的商品类目,如服饰类、家居类、食品类等。 类目数据是指每个商品类目的具体信息,包括类目名称、类目级别、类目图标等。每个类目都有一个唯一的类目名称,用于在网站上显示给用户,方便用户浏览和搜索类目级别表示该类目淘宝商品分类中的层级位置,一级类目为最高级别,二级类目为一级类目的子类目,以此类推。类目图标是类目的标识符,用于在网站上展示给用户,方便用户识别和选择。 淘宝商品大类id类目数据的存在,方便用户在淘宝网站上浏览和搜索自己感兴趣的商品。用户可以通过浏览大类id类目数据,快速找到自己所需要的商品类别,并进一步浏览该类目下的各个子类目和具体商品类目数据的合理设置和分类,可以提升用户的购物体验,提高淘宝网站的整体运营效率。同时,对于淘宝卖家来说,淘宝商品大类id类目数据的准确和完善,也是他们进行商品发布和销售的重要依据。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值