常识知识是被社会广泛承认的对同一事物普遍存在的日常共识。显著性常识是指:当被问及一个概念,如跑步,人容易直接联想到的包含该概念的常识,如跑步需要跑步鞋。在电商场景中,显著性常识基于背后的知识体系,能为不同的用户推荐合适的商品,对用户体验和购物效率有重要的意义。
现有的常识分类方法往往只注重评判常识是否合理,如 “跑步需要喝水”、“出差需要背包”,都是合理的。但当在电商平台搜索 “跑步” 时,瓶装水一般不是用户真实的购物意图,人直接联想到的商品一般是跑步鞋、跑步机;在搜索 “出差” 时,包一般并不是用户需要的商品,但旅行箱一般是需要的商品。显著的常识可以帮助搜索引擎有更好的理解能力,从而返回更贴合用户需要的商品。
因此,本子任务是评估电商常识三元组显著性。任务涵盖服装、食品、运动、生活用品等商品品类和相关电商概念的常识三元组,表示为(S,P,O)。关系包含3类,包括蕴含、适用、搭配,头尾实体有人物、场景、品类3种类型。蕴含关系代表人物到场景的关系,具体表示为人物_蕴含_场景,比如(高中生,人物_蕴含_场景,高考),头实体和尾实体顺序不能调换。适用关系代表品类到人物、场景的关系,具体表示为品类_适用_场景、品类_适用_人物,比如(跑步鞋,品类_适用_场景,跑步),关系头实体和尾实体顺序不能调换。搭配关系代表品类之间的关系,具体表示为品类_搭配_品类,比如(鱼竿,品类_搭配_品类,鱼饵),此类关系头实体和尾实体顺序可以调换。参赛者需要判断给定的常识三元组的显著性,为了简化问题,此次任务我们定义为判断常识三元组是否显著的二分类任务。