知识图谱(KG/Neo4j)
文章平均质量分 95
悟乙己
心如花木,皆向阳而生!
展开
-
简单实践GraphEmbedding图嵌入的几种方法
参考:详解Graph Embedding经典方法:算法原理、代码实现与应用样例Graph Embedding 图表示学习的原理及应用代码参考:https://github.com/shenweichen/GraphEmbedding本篇简单测试一下该库文章目录1 Graph Embedding 几种常见方法1.1 DeepWalk1.2 LINE1.3 nodo2vec1.4 SDNE1.5 Struc2Vec2 实验代码1 Graph Embedding 几种常见方法Mod原创 2021-07-14 18:41:28 · 1992 阅读 · 0 评论 -
聚类 | Map-Equation多级网络聚类模型——InfoMap
受苏神的《最小熵原理(五):“层层递进”之社区发现与聚类》启发,拿来做词聚类,看苏神的贴出来的效果蛮好,就上手试了试,感觉确实不错。最新的v1.0版本还有专门网站:https://mapequation.github.io/infomap/1 简单的理论Infomap 的双层编码方式把群组识别(社区发现)同信息编码联系到了一起。一个好的群组划分,可以带来更短的编码。所以,如果能量化编码长度...原创 2020-02-07 16:34:56 · 6967 阅读 · 4 评论 -
neo4j︱neo4j批量导入neo4j-import (五)
neo4j数据批量导入目前主要有以下几种数据插入方式:(转自:如何将大规模数据导入Neo4j) Cypher CREATE 语句,为每一条数据写一个CREATE Cypher LOAD CSV 语句,将数据转成CSV格式,通过LOAD CSV读取数据。 官方提供的Java API —— Batch Inserter 大牛编写的 Batch Import 工具 官方提供的 neo4j-...原创 2018-09-05 16:04:38 · 22952 阅读 · 6 评论 -
知识图谱+Recorder︱中文知识图谱API与工具、科研机构与算法框架
分为两个部分,笔者看到的知识图谱在商业领域的应用,外加看到的一些算法框架与研究机构。一、知识图谱商业应用01 唯品金融大数据使用的是OrientDB,Orientdb提供了大量的接口, 其中最常用的就是Gremlin和sql。Gremlin是Apache TinkerPop 框架下的图遍历语言。Gremlin是一种函数式数据流语言,可以使得用户使用简洁的方式表述复杂...原创 2017-03-26 12:09:32 · 37184 阅读 · 0 评论 -
练习题︱豆瓣图书的推荐与搜索、简易版知识引擎构建(neo4j)
DouBanRecommend基于豆瓣图书的推荐、知识图谱与知识引擎简单构建neo4j本项目主要贡献源来自豆瓣爬虫(数据源)lanbing510/DouBanSpider、知识图谱引擎Agriculture_KnowledgeGraph、apple.turicreate中内嵌的推荐算法。 主要拿来做练习,数据来源可见lanbing510/DouBanSpider。练习内容:豆瓣...原创 2018-04-24 18:57:44 · 3212 阅读 · 3 评论 -
neo4j︱Cypher 查询语言简单案例(二)
图数据库常规的有:neo4j(支持超多语言)、JanusGraph/Titan(分布式)、Orientdb,google也开源了图数据库Cayley(Go语言构成)、PostgreSQL存储RDF格式数据。—- 目前的几篇相关:—– neo4j︱图数据库基本概念、操作罗列与整理(一) neo4j︱Cypher 查询语言简单案例(二) neo4j︱Cypher完整案例csv导入、关系联通、...原创 2018-04-08 12:54:51 · 12573 阅读 · 0 评论 -
neo4j︱与python结合的py2neo使用教程(四)
图数据库常规的有:neo4j(支持超多语言)、JanusGraph/Titan(分布式)、Orientdb,google也开源了图数据库Cayley(Go语言构成)、PostgreSQL存储RDF格式数据。—- 目前的几篇相关:—– neo4j︱图数据库基本概念、操作罗列与整理(一) neo4j︱Cypher 查询语言简单案例(二) neo4j︱Cypher完整案例csv导入、关系联通、...原创 2018-04-11 18:55:21 · 34390 阅读 · 6 评论 -
neo4j︱图数据库基本概念、操作罗列与整理(一)
图数据库常规的有:neo4j(支持超多语言)、JanusGraph/Titan(分布式)、Orientdb,google也开源了图数据库Cayley(Go语言构成)、PostgreSQL存储RDF格式数据。—- 目前的几篇相关:—– neo4j︱图数据库基本概念、操作罗列与整理(一) neo4j︱Cypher 查询语言简单案例(二) neo4j︱Cypher完整案例csv导入、关系联通、...原创 2018-04-10 16:40:06 · 13451 阅读 · 0 评论 -
neo4j︱Cypher完整案例csv导入、关系联通、高级查询(三)
图数据库常规的有:neo4j(支持超多语言)、JanusGraph/Titan(分布式)、Orientdb,google也开源了图数据库Cayley(Go语言构成)、PostgreSQL存储RDF格式数据。—- 目前的几篇相关:—– neo4j︱图数据库基本概念、操作罗列与整理(一) neo4j︱Cypher 查询语言简单案例(二) neo4j︱Cypher完整案例csv导入、关系联通、...原创 2018-04-08 15:24:53 · 31841 阅读 · 1 评论 -
笔记︱基于网络节点的node2vec、论文、算法python实现
看到一个很有意思的算法,而且腾讯朋友圈lookalike一文中也有提及到,于是蹭一波热点,学习一下。论文是也发KDD2016 . .一、主要论文:node2vec: Scalable Feature Learning for Networks本节引用自 a、微博洪亮劼 :【论文每日读】node2vec: Scalable Feature Learning for Networksb原创 2017-01-13 10:34:45 · 38720 阅读 · 3 评论 -
关系网络理论︱细讲中介中心性(Betweeness Centrality)
关系网络在我认为都是一种很简单暴力地能挖掘人群特征关系的一种方式,特别今天去听了一场关于AI与金融领域的结合,里面提到了拓扑分析其实就是关系网络的解释。我在之前的文章( R语言︱SNA-社会关系网络—igraph包(中心度、中心势)(二))之中提到过几个中心度指标的对比,在网上看到了这个中介中心性的理论,po来以备后用~中介中心性(Betweeness Centrality),又叫中间中心性转载 2017-01-07 21:05:28 · 39858 阅读 · 0 评论 -
R语言︱SNA-社会关系网络 R语言实现专题(基础篇)(一)
笔者寄语:由于笔者参加了一个全国数据挖掘大赛的比赛,所选赛题是招聘岗位的数据挖掘,笔者用到了社会关系网络来进行相关职位的推荐以及分类,发现了SNA可以实现一定的职位画像的功能,于是根本停不下来的学习了SNA。学习之后内容有点多,想分成基础篇、社群发现篇、画图篇、案例篇、组合技巧篇。一、关系网络数据类型关系网络需要什么样子的数据呢? 笔者接触到了两种数据结构,擅原创 2016-05-17 16:20:00 · 24084 阅读 · 4 评论 -
R语言︱SNA-社会关系网络—igraph包(中心度、中心势)(二)
SNA社会关系网络分析中,关键的就是通过一些指标的衡量来评价网络结构稳定性、集中趋势等。主要有中心度以及中心势两大类指标。以下的代码都是igraph包中的。一、中心度中心度指标有四类点度中心度、接近中心度、中间中心度、特征向量中心度。1、点度中心度——点出度、点入度、相对点中心度、点度频率有两个部分:绝对中心度+相对中心度。是最基本的概念,就是在某个点上,有多少原创 2016-05-18 15:12:19 · 48805 阅读 · 7 评论 -
R语言︱SNA-社会关系网络—igraph包(社群划分、画图)(三)
社群划分跟聚类差不多,参照《R语言与网站分析》第九章,社群结构特点:社群内边密度要高于社群间边密度,社群内部连接相对紧密,各个社群之间连接相对稀疏。那么一、社群发现模型1、基于点连接的社群发现——clusters如果一个点与社群有联系则放在一个网络中,简单易懂,耗时短,但是分类效果并不特别好。clusters(g.dir,mode="weak")原创 2016-05-18 16:24:42 · 56866 阅读 · 6 评论 -
R语言︱贝叶斯网络语言实现及与朴素贝叶斯区别(笔记)
每每以为攀得众山小,可、每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~——————————————————————————— 一、贝叶斯网络与朴素贝叶斯的区别 朴素贝叶斯的假设前提有两个第一个为:各特征彼此独立;第二个为且对被解释变量的影响一致,不能进行变量筛选。但是很多情况这一假设是无法做到的,比如解决文本分类时,相...原创 2016-11-26 00:04:06 · 24946 阅读 · 15 评论 -
用GA算法设计22个地点之间最短旅程-R语言实现
数据挖掘入门与实战 公众号: datadw某毕业班共有30位同学,来自22个地区,我们希望在假期来一次说走就走的旅行,将所有同学的家乡走一遍。算起来,路费是一笔很大的花销,所以希望设计一个旅行方案,确保这一趟走下来的总路程最短。旅行商问题是一个经典的NP问题NP就是Non-deterministic Polynomial,即多项式复转载 2016-10-01 22:51:43 · 3979 阅读 · 0 评论