I. 知识图谱 应用案例 — 阿里巴巴电商知识图谱
概述
- 通用知识图谱:实体之间的客观存在的关系
- 常识知识图谱:概念之间的常识关系
- 什么是常识
- 社会对同一事物普遍存在的日常和普遍共识
- 常识关系是隐藏在背后的知识,不会明确的说出来
- 常识让我们可以体会言外之意
- 大多数尝试都是隐性的,这使得常识很难明确表达出来
- 常识关系的两个极端“你说的对”VS “这还用你说”
- 常识是通过人的行为、听、学一点一点积累起来的
- 计算机肯定不知道的知识
- 什么是电商常识
- 在电商域,社会对同一事物普遍存在的日常和普遍共识
- 什么是电商知识图谱
- 以三元组<S,P,Q>结构化表示的电商概念间的常识关系
- 例如
- 连衣裙 品类是一种品装 女装
- 高跟鞋 品类适用人群 女性
- 羽绒服 品类蕴涵功能 保暖
- 什么是常识
- 为什么做电商图谱
- 深入理解用户想要什么样的商品
- 深入理解品类涉及到的各类信息
- 对用户需求和商品做桥接
- 从感知智能到认知智能重要途径
- 帮助机器实现理解、解释、推理能力
- 是认知智能的底层支撑
- 为什么做电商知识图谱
- 通用图谱的关系数据大多是实体间的关系
- 电商关系主要是概念间的关系
- 概念间的关系建模较难
- 常识,或者说确定性才是可以直接使用的知识,如
- 连衣裙 品类适用人群 女性
- 连衣裙 品类蕴涵颜色 黑色
- 与外部常识图谱区别
- 高准确性:以电商认知图谱为约束,覆盖更多的、高准的电商底层词库,苟安知识的准确率更高
- 细粒度
- 定义了细粒度的尝试关系
- 品类适用人群
- 广泛性
- 与电商有关的、重点的尝试关系都定义
- 侧重性:根据应用的优先级进行重点挖掘
规模
- 电商本体分类非常细
- 共几千分类
- 品类下几千分类
- 无形物下几百分类,属性相关类
- 共几千分类
- 常识知识图谱:选择了 37 种电商本体作为常识知识图谱的基础类型
常识知识图谱模型
- 等义
- 品类等义定义:尿不湿&纸尿片、宝宝秤&婴儿秤
- 人群等义定于:高个子&大个子、青年&年轻人
- 别名
- 品类别名品类:A型裙&A字裙&A裙
- 人群别名人群:丈母娘&丈母&岳母
- 互斥
- 品类互斥品类:火锅&蒸锅、拖鞋&运动鞋
- 人群互斥人群:老爸&爷爷、胖人&瘦小
- 是一种
- 品类是一种品类:主题T恤&T恤、主卧床&床
- 人群是一种人群:高二孩子&高中生、高中生&学生党
- 是一部分
- 品类是品类的一部分:锯条&锯子、被芯&被子
- 人群是人群的一部分:妈妈&爸妈、爸爸&爸妈
- 反义
- 品类反义品类:大盆景&小盆景、高帮鞋&低帮鞋
- 人群是人群一部分:胖妹妹&廋女生、老年人&年轻人
- 适用
- 品类适用人群:吸奶器&产妇、须后水&男式
- 品类适用场景:瘦身精油&减肥、食用油&烹饪
- 不适用
- 款式不适用时间:冬款&夏季、加厚型&夏季
- 需要
- 人群需要品类:男式&须后水、小学生&铅笔
- 场景需要品类:烹饪&食用油、垂钓&鱼竿
- 不需要
- 时间不需要款式:夏季&加厚型、夏季&冬款
- 生产
- 地点特产品类:黑龙江&五常米、辽宁&南果梨
- 蕴含
- 人群蕴含场景:高中&高考、新娘&敬酒
- 款式蕴含功能:一字肩&漏锁骨、中长款&防晒黑
- 不蕴含
- 人群不蕴含场景:高中&考博
- 所属
- 款式所属品类:低胸&长裙、低帮&皮鞋
- 发生在
- 节日节气发生在时间:七夕&七月、中秋&八月
- 气象状态发生在时间:严寒&冬季、炙热&夏季
- 是配件
- 品类是品类配件:手机壳&手机
- 近义
- 品类近义品类:厨具刀&切菜刀
- 搭配
- 品类搭配品类:连衣裙&高跟鞋
- 对应
- 人群对应时间:新郎&婚礼
应用
- 常识一般分为13个维度
- 电商常识图谱覆盖其中十个维度
- 相似
- 区别
- 分类
- 部分-整体
- 空间
- 创造
- 效用
- 需要
- 特性
- 其他
- 未覆盖
- 词汇:词根、单复数等,中文不存在
- 比较:x 比 y 大
- 时序:吃饭需要先张嘴
- 电商常识图谱覆盖其中十个维度