图数据的导入:
两个思路:
1,结构话数据,提供统一字段结构(点label表,边label表),或者做字段映射。
2,非结构话数据,小数据:通过人工标注平台,大数据 通过 nlp 抽取(难度很大,可以先抽点,在标关系)
1,基于图的搜索:两个部分
部分1:基于图的搜索,
简单实现,不要kbqa
点(点label-)------边(边label)----属性,三者之间的关联关系的搜索。一般的搜索模式应该是:
基础搜索模式:
点的搜索:
1,属性----点label —> 点
边的搜索
2, 属性-----边label----> 边
1,2 原型设计:
类型:【点/边】label:【label】 属性名(text):[关键字] 属性名(int):[ ]~[ ]范围1~范围2
属性要根据类型设置筛选方式,int 类型 设置 范围,text/string 设置关键字
1,2可以通过搜索引擎实现,也可以通过其他数据库实现。
————————————这个以上简单的实现不通过nlp 模型,做到这个程度,我觉得就可以了。至于 点—属性,边--属性,点--边----点等,可以通过部分2 的图探索,图筛选实现。
复杂实现:
人工智能 实现kbqa:
实现1,2以外
还可以实现点—属性,边--属性,点--边--点等
目前 支持固定句式开发应该比较好实现,特殊场景句式,需要特殊定制,开发。
比如 姚明的母亲的年龄。
部分2:基于部分1的图相邻点展示。(图探索)
在展示的基础上
应该设置简单的筛选操作(label,边方向,复杂一点属性筛选(基于边label,点label)),这一部分放前端比较好开发。放到后端的话,设计图数据的缓存。
知识卡片,数据统计