一、知识图谱搭建流程
问题定义-》数据收集-》数据预处理-》设计知识图谱-》存储知识图谱-》应用知识图谱-》评估系统
二、知识图谱设计原则
1)需要哪些实体、关系、属性?
2)哪些属性可以作为实体,哪些实体可以作为属性?
3)那些信息不需要放在知识图谱?
三、业务原则(Business Principle)
一切要从业务的逻辑出发,通过观察知识图谱的设计也很容易推测背后业务的逻辑。而且设计时也要想好未来业务的变化
以人为中心
四、分析原则 (Analytic Principle)
知识图谱任何一个实体都是为关系分析而服务,如果一个实体对分析网络结构没有帮助,则可以设置成属性甚至不要放在知识图谱里
电话作为知识图谱中最重要的实体之一,电话作为实体,可以构成有效的电话网络。名字作为属性放到实体里面。
五、冗余原则
知识图谱中经常存在一些节点和大部分的节点存在链接关系。其实这些节点的意义不大,同时也会急剧降低系统的查询效率。重复信息也需要避免存储。
六、效率原则
知识图谱尽量轻便,存关键的信息,剩下的可以存储在传统的数据库中。