导读:随着现有数据获取技术手段的提高,获取的各种人类行为数据量剧增,话单数据、出行数据是其中的典型代表,其中潜藏着各种类型的人员关系,这些人员关系可支撑密切接触者查找、嫌疑人查找、团伙发现、商品推销等多方面的应用,如何从这些海量数据中挖掘分析出各种人员关系是急需解决的问题。
人员信息数据包含人员的基本信息,如姓名、证件号码、电话号码等;话单数据包含通话信息,如用户号码、对端号码等;火车/航班出行数据包含人员的出行信息,如姓名、证件号码、车次/航班等。基于话单数据可以进行共同联系人分析,基于出行数据可以进行共同出行人分析。将以上三类数据构建多维关系网络存入图数据库,可以快速准确地找到既有共同出行又有通话的人员,即重点关系人。
基于Galaxybase图数据库的人员关系挖掘方法原理图如下图所示。
创建模型
接下来使用Galaxybase图数据库来创建数据模型。
点类型和点属性如下表所示。
点类型 | 点属性 |
---|---|
人员信息数据 | 外部唯一标识(证件号码)、姓名、性别、出生日期、年龄、国籍、电话号码 |
话单数据 | 外部唯一标识(用户号码)、对端号码、主叫数、被叫数、发送短信数、接收短信数 |
出行数据 | 外部唯一标识(车次/航班号)、姓名、证件号码、出行日期、出发地、目的地、座位号 |
边类型、起始点类型、终止点类型如下表所示。
边类型 | 起始点类型 | 终止点类型 |
---|---|---|
拥有(一对多) | 人员信息数据 | 话单数据 |
出行(一对多) | 人员信息数据 | 出行数据 |
建模后如下图所示。
更多图模型构建方式请参考图构建。
共同联系人分析
手机话单分析具有定人、定时、定位、定关系等特性,所以其在公安机关、检察院机关的线索初查、审讯突破及人员追逃等方面有独特作用。
共同联系人分析功能主要用于寻找多个号码之间的共同联系人,可以是两个号码之间,也可以是多个号码之间。该功能可以支撑很多应用,例如找出通话的共同目标,为办案提供更多线索;在传染病防御方面快速找到可能与确诊病人或疑似病人有密切接触的人员。共同联系人分析的方法流程图如下图所示。
共同出行人分析
火车/航班出行数据反映了人员的出行情况,从中可以分析挖掘出其同航班或者同火车车次的共同出行人。共同出行人分析功能主要用于寻找一个或者多个人员的共同出行人,可以是一个人的共同出行人,也可以是两个或者多个人员的共同出行人。
共同出行人分析可以支撑流行传染病患者密切接触人追踪、嫌疑人查找、团伙发现等应用。共同联系人分析的方法流程图如下图所示。
重点关系人分析
关系人分析主要是从大量数据中挖掘潜在的、不为人知的、人与人之间的各种关系。共同联系人分析的方法流程图如下图所示。
关系人分析主要是从大量数据中挖掘潜在的、不为人知的、人与人之间的各种关系。共同联系人分析的方法流程图如下图所示。
-END
感兴趣的朋友可以关注我们的微信公众号(搜索:创邻科技),了解更多图数据库前沿技术。