作者:等你归去来
出处:https://www.cnblogs.com/yougewe/p/13865184.html
知识图谱听起来很高大上,而且也应用广泛。而图数据库,你可以到网上搜搜,基本就是像 neo4j, janusgraph, HugeGraph...
如果想让做个类似的图谱的东西,你会怎么办呢?一来就上真的图谱真的好吗?也许前期就三两个关系链,也许只是业务试水,你就去搞个真的图数据库过来?是不是太浪费了。
是的,实际上前期我们最好自己实现一些简单的关系链维护即可。
那么,为了能够适应稍微的关系变化,也许我们还是需要效仿下图数据库的概念。那么,现在的第一个问题就是:如何使用文字表述一个图关系链?
1. 如何定义规范?
图数据库三大要素: 实体, 关系, 客体 。
实际上要解决这个问题倒也不难,只要自己定一种表示方法,自己能看懂就行,不去管其他人。比如用 '1,2,3' 代表先1后2再3... 但实际上,想要表示稍微复杂点的结构,也许并不是特别容易呢。而且,如果想要考虑后续可能的切真正的图数据库,为何不参考下别人的标准呢?
比如现在通用些的,cypher, gremlin... 大家可以网上搜索下资料,参考下来,好像cypher更形象化些,尤其是各种箭头的使用比较方便。
比如要表示A与的B的关系可以是: (:A)-[:关系]->(:B)
而对于多个复杂关系,则可以用多个类似的关系关联起来就可以了。
嗯,看起来不错。表示的方式定好了,那么我们如何具体处理关系呢?
2. 如何表示一个现实的图关系?
如下图所示,我们有如下关系,应该如何定义字符表达方法,以达到配置的目的?
按照第1节中我们定义的规范,我们可以用如下字符串表示。
(:PEOPLE)-[:养宠物]->(:CAT)-[:吃]->(:RICE) ,(:PEOPLE)-[:吃]->(:RICE) ,(:PEOPLE)-[:养宠物]->(:DOG) ,(:PEOPLE)-[:拥有]->(:HOUSE) ,(:PEOPLE)-[:干活]->(:JOB) ,(:CAT)-[:朋友]->(:DOG) ,(:DOG)-[:吃]->(:RICE) ,(:JOB)-[:产出]->(:BRICK) ,(:HOUSE)
应该说还是比较直观的,基本上我们只要按照图所示的关系,描述出出入边和关系就可以了。而且还有相应的cypher官方规范支持,也不用写文档,大家就可以很方便的接受了。
3. 如何解析图关系?
如上,我们已经用字符串表示出了关系了。但单是字符串,是并不能被应用理解的。我们需要解析为具体的数据结构,然后才可以根据关系推导出具体的血缘依赖。这是本文的重点。
实际也不复杂,我们仅仅使用到了cypher中非常少的几个元素表示法,所以也仅需解析出该几个字符,然后在内存中构建出相应的关系即可。
具体代码实现如下:
3.1. 解析框架
所谓框架就是整体流程管控代码,它会让你明白整个系统是如何work的。
import com.my.mvc.app.common.helper.graph.GraphNodeEntityTree;import com.my.mvc.app.common.helper.graph.NodeDiscoveryDirection;import com.my.mvc.app.common.helper.graph.VertexEdgeSchemaDescriptor;import com.my.mvc.app.common.helper.graph.VertexOrEdgeType;import com.my.mvc.app.common.util.CommonUtil;import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;/** * 功能描述: 简单图语法解析器(类 cypher 语法) * * 请参考网上 cypher 资料 * */public class SimpleGraphSchemaSyntaxParser { /** * 解析配置图谱关系配置为树结构 * * @param cypherGraphSchema 类cypher语法的 关系表示语句 * @return 解析好的树结构 */ public static GraphNodeEntityTree parseGraphSchemaAsTree(String cypherGraphSchema) { List flatNodeList = tokenize(cypherGraphSchema); return buildGraphAstTree(flatNodeList); } /** * 构建图关系抽象语法树 * * @param flatNodeList 平展的图节点列表 * @return 构建好的实例 */ private static GraphNodeEntityTree buildGraphAstTree( List flatNodeList) { Map uniqVertexContainer = new HashMap<>(); GraphNodeEntityTree root = new GraphNodeEntityTree(flatNodeList.get(0)); uniqVertexContainer.put(flatNodeList.get(0).getVertexLabelType(), root); GraphNodeEntityTree parent; GraphNodeEntityTree afterNode; for ( int i = 1; i < flatNodeList.size(); i++ ) { VertexEdgeSchemaDescriptor vertexOrEdge1 = flatNodeList.get(i); if(vertexOrEdge1.getNodeType() == VertexOrEdgeType.EDGE) { // 存在重复节点,需重建关系 VertexEdgeSchemaDescriptor vertexPrev = flatNodeList.get(i - 1); if(vertexPrev.getNodeType() != VertexOrEdgeType.VERTEX) { continue; } if(++i >= flatNodeList.size()) { throw new RuntimeException("缺少客体关系配置, near 边[" + vertexOrEdge1.getRawWord() + "]"); } VertexEdgeSchemaDescriptor relation = vertexOrEdge1; VertexEdgeSchemaDescriptor vertexAfter = flatNodeList.get(i); parent = uniqVertexContainer.get(vertexPrev.getVertexLa