51号公路-CSDN博客

原创 python连接janusgraph并且导数据

1：安装gremlin_python包gremlin_python包2：打开janusgraph如下图位置3：查看参数，连接时要用到4：上代码# -*- coding: utf-8 -*-# @Time : 2019/11/6 19:52# @Author : Administrator# @Project : chenhong# @FileName: janusgrap...

2020-04-28 10:10:41 1945 3

原创 Neo4j创建多图

1：找到neo4j安装目录，编辑conf文件夹中的neo4j.conf2：使用notepad编辑neo4j.conf文件红色箭头是默认图名，复制dbms.active_database= 后面加新增的图名，如图所示，并且解除注释3：重启neo4j即可，可以看到已改为新的图数据库4：在data/database中可以看到新增的数据库...

2020-04-27 09:29:18 2183

原创 pyspark RDD详细教程

Spark的核心是RDD（Resilient Distributed Dataset）即弹性分布式数据集，属于一种分布式的内存系统的数据集应用，这些元素在多个节点上运行和操作，以便在集群上进行并行处理。Spark主要优势就是来自RDD本身的特性，RDD能与其他系统兼容，可以导入外部存储系统的数据集，例如，HDFS、HBase或者其他Hadoop数据源1、RDD的基本运算RDD运算类型...

2020-04-21 10:25:51 3434 1

原创 word2vec一些基本用法

`# -- coding: utf-8 --@Time : 2020/4/15 9:34@Author : Administrator@Project : chenhong@FileName: test.py@Desc : ==============================================Please prepare your document ...

2020-04-15 15:20:43 770

原创 word2vec训练维基中文语料

前期准备1、语料：维基中文语料 (下载地址：https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2）搜狗实验室语料 (下载地址：http://www.sogou.com/labs/resource/ca.php)2、所用工具：（1）python版gensim安装（pip insta...

2020-04-14 17:50:14 348

原创升级gcc 亲测可用

#!/bin/bash 升级gcc 亲测可用cd /user/src#获取源码(由于官方镜像速度较慢，这里使用了中国科学院开源协会的镜像#sudo wget http://mirrors.opencas.org/gnu/gcc/gcc-6.3.0/gcc-6.3.0.tar.bz2#如果以上给出的镜像不可用，也可以是使用http://ftp.gnu.org/gnu/gcc/，但由于...

2020-04-13 09:54:20 274 1

原创 fasttext学习使用入门

fasttext源码位置功能一：单词表达模型1:为了学习词向量(向量表示)，我们可以使用fasttext.train_unsupervised函数，像下面这样：import fasttext# Skipgram model :model = fasttext.train_unsupervised('data.txt', model='skipgram')# or, cbow mod...

2020-03-22 17:45:33 1208

原创 stanford coreNLP安装

stanford-chinese-corenlp-2018-10-05-models.jar需要下载的资源1：下载安装JDK 1.8及以上版本。2：下载Stanford CoreNLP文件，解压。3：处理中文还需要下载中文的模型jar文件，然后放到stanford-corenlp-full-2018-10-05根目录下即可（注意一定要下载这个文件，否则它默认是按英文来处理的）安装过程1...

2020-03-16 16:30:27 874

WORD2VEC.zip

word2vec训练维基中文语料的三个文件，process.py为处理维基中文保存为wiki.zh.text，然后用opencc把繁体化为简体中文wiki.zh.text.jian.txt，然后用fenci_model.py进行分词生成wiki.zh.seg.text.jian.txt，最后用train_word2vec_model.py进行训练

2020-04-14

NamedEntityDisambiguation - test.zip

这份代码属于NLP功能中的实体消歧-共指消解。对输入的一段语句中，指向同一个实体的不同名称进行查找，计算相似度，完成替换。用的是余弦相似度和TFIDF，思路比价简单，方法比较粗糙，但是只要对该实体的desc(描述性语句)够多，效果应该很不错

2020-03-25

QASystemOnHepatopathyKG-master.zip

基于知识图谱和规则的医疗问答系统,从实体创建到资源导入，从问题分类到问题解析，再到SQL查询，一整套完整的代码，经过本人的测试，可以跑通，效果很不错。并且迁移性高，可以根据自己的需求，改写。具体的操作可以看Readmechenghong.txt 里面是我构建实体画像问答的完整过程

2020-03-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人