I. 知识图谱 应用案例 --- 阿里巴巴电商知识图谱

I. 知识图谱 应用案例 — 阿里巴巴电商知识图谱

概述

  • 通用知识图谱:实体之间的客观存在的关系
  • 常识知识图谱:概念之间的常识关系
    • 什么是常识
      • 社会对同一事物普遍存在的日常和普遍共识
      • 常识关系是隐藏在背后的知识,不会明确的说出来
      • 常识让我们可以体会言外之意
      • 大多数尝试都是隐性的,这使得常识很难明确表达出来
      • 常识关系的两个极端“你说的对”VS “这还用你说”
      • 常识是通过人的行为、听、学一点一点积累起来的
      • 计算机肯定不知道的知识
    • 什么是电商常识
      • 在电商域,社会对同一事物普遍存在的日常和普遍共识
    • 什么是电商知识图谱
      • 以三元组<S,P,Q>结构化表示的电商概念间的常识关系
      • 例如
        • 连衣裙 品类是一种品装 女装
        • 高跟鞋 品类适用人群 女性
        • 羽绒服 品类蕴涵功能 保暖
  • 为什么做电商图谱
    • 深入理解用户想要什么样的商品
    • 深入理解品类涉及到的各类信息
    • 对用户需求和商品做桥接
    • 从感知智能到认知智能重要途径
      • 帮助机器实现理解、解释、推理能力
      • 是认知智能的底层支撑
  • 为什么做电商知识图谱
    • 通用图谱的关系数据大多是实体间的关系
    • 电商关系主要是概念间的关系
    • 概念间的关系建模较难
    • 常识,或者说确定性才是可以直接使用的知识,如
      • 连衣裙 品类适用人群 女性
      • 连衣裙 品类蕴涵颜色 黑色
  • 与外部常识图谱区别
    • 高准确性:以电商认知图谱为约束,覆盖更多的、高准的电商底层词库,苟安知识的准确率更高
    • 细粒度
      • 定义了细粒度的尝试关系
      • 品类适用人群
    • 广泛性
      • 与电商有关的、重点的尝试关系都定义
    • 侧重性:根据应用的优先级进行重点挖掘

规模

  • 电商本体分类非常细
    • 共几千分类
      • 品类下几千分类
      • 无形物下几百分类,属性相关类
  • 常识知识图谱:选择了 37 种电商本体作为常识知识图谱的基础类型

常识知识图谱模型

  • 等义
    • 品类等义定义:尿不湿&纸尿片、宝宝秤&婴儿秤
    • 人群等义定于:高个子&大个子、青年&年轻人
  • 别名
    • 品类别名品类:A型裙&A字裙&A裙
    • 人群别名人群:丈母娘&丈母&岳母
  • 互斥
    • 品类互斥品类:火锅&蒸锅、拖鞋&运动鞋
    • 人群互斥人群:老爸&爷爷、胖人&瘦小
  • 是一种
    • 品类是一种品类:主题T恤&T恤、主卧床&床
    • 人群是一种人群:高二孩子&高中生、高中生&学生党
  • 是一部分
    • 品类是品类的一部分:锯条&锯子、被芯&被子
    • 人群是人群的一部分:妈妈&爸妈、爸爸&爸妈
  • 反义
    • 品类反义品类:大盆景&小盆景、高帮鞋&低帮鞋
    • 人群是人群一部分:胖妹妹&廋女生、老年人&年轻人
  • 适用
    • 品类适用人群:吸奶器&产妇、须后水&男式
    • 品类适用场景:瘦身精油&减肥、食用油&烹饪
  • 不适用
    • 款式不适用时间:冬款&夏季、加厚型&夏季
  • 需要
    • 人群需要品类:男式&须后水、小学生&铅笔
    • 场景需要品类:烹饪&食用油、垂钓&鱼竿
  • 不需要
    • 时间不需要款式:夏季&加厚型、夏季&冬款
  • 生产
    • 地点特产品类:黑龙江&五常米、辽宁&南果梨
  • 蕴含
    • 人群蕴含场景:高中&高考、新娘&敬酒
    • 款式蕴含功能:一字肩&漏锁骨、中长款&防晒黑
  • 不蕴含
    • 人群不蕴含场景:高中&考博
  • 所属
    • 款式所属品类:低胸&长裙、低帮&皮鞋
  • 发生在
    • 节日节气发生在时间:七夕&七月、中秋&八月
    • 气象状态发生在时间:严寒&冬季、炙热&夏季
  • 是配件
    • 品类是品类配件:手机壳&手机
  • 近义
    • 品类近义品类:厨具刀&切菜刀
  • 搭配
    • 品类搭配品类:连衣裙&高跟鞋
  • 对应
    • 人群对应时间:新郎&婚礼

应用

  • 常识一般分为13个维度
    • 电商常识图谱覆盖其中十个维度
      • 相似
      • 区别
      • 分类
      • 部分-整体
      • 空间
      • 创造
      • 效用
      • 需要
      • 特性
      • 其他
    • 未覆盖
      • 词汇:词根、单复数等,中文不存在
      • 比较:x 比 y 大
      • 时序:吃饭需要先张嘴
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值