自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (3)
  • 收藏
  • 关注

原创 python连接janusgraph并且导数据

1:安装gremlin_python包gremlin_python包2:打开janusgraph如下图位置3:查看参数,连接时要用到4:上代码# -*- coding: utf-8 -*-# @Time : 2019/11/6 19:52# @Author : Administrator# @Project : chenhong# @FileName: janusgrap...

2020-04-28 10:10:41 1945 3

原创 Neo4j创建多图

1:找到neo4j安装目录 ,编辑conf文件夹中的neo4j.conf2:使用notepad编辑neo4j.conf文件红色箭头是默认图名,复制dbms.active_database= 后面加新增的图名,如图所示,并且解除注释3:重启neo4j即可,可以看到已改为新的图数据库4:在data/database中可以看到新增的数据库...

2020-04-27 09:29:18 2183

原创 pyspark RDD详细教程

Spark的核心是RDD(Resilient Distributed Dataset)即弹性分布式数据集,属于一种分布式的内存系统的数据集应用,这些元素在多个节点上运行和操作,以便在集群上进行并行处理。Spark主要优势就是来自RDD本身的特性,RDD能与其他系统兼容,可以导入外部存储系统的数据集,例如,HDFS、HBase或者其他Hadoop数据源1、RDD的基本运算RDD运算类型...

2020-04-21 10:25:51 3434 1

原创 word2vec一些基本用法

`# -- coding: utf-8 --@Time  : 2020/4/15 9:34@Author : Administrator@Project : chenhong@FileName: test.py@Desc : ==============================================Please prepare your document ...

2020-04-15 15:20:43 770

原创 word2vec训练维基中文语料

前期准备1、语料:维基中文语料 (下载地址:https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2)搜狗实验室语料 (下载地址:http://www.sogou.com/labs/resource/ca.php)2、所用工具:(1)python版gensim安装(pip insta...

2020-04-14 17:50:14 348

原创 升级gcc 亲测可用

#!/bin/bash 升级gcc 亲测可用cd /user/src#获取源码(由于官方镜像速度较慢,这里使用了中国科学院开源协会的镜像#sudo wget http://mirrors.opencas.org/gnu/gcc/gcc-6.3.0/gcc-6.3.0.tar.bz2#如果以上给出的镜像不可用,也可以是使用http://ftp.gnu.org/gnu/gcc/,但由于...

2020-04-13 09:54:20 274 1

原创 fasttext学习使用入门

fasttext源码位置功能一:单词表达模型1:为了学习词向量(向量表示),我们可以使用fasttext.train_unsupervised函数,像下面这样:import fasttext# Skipgram model :model = fasttext.train_unsupervised('data.txt', model='skipgram')# or, cbow mod...

2020-03-22 17:45:33 1208

原创 stanford coreNLP安装

stanford-chinese-corenlp-2018-10-05-models.jar需要下载的资源1:下载安装JDK 1.8及以上版本。2:下载Stanford CoreNLP文件,解压。3:处理中文还需要下载中文的模型jar文件,然后放到stanford-corenlp-full-2018-10-05根目录下即可(注意一定要下载这个文件,否则它默认是按英文来处理的)安装过程1...

2020-03-16 16:30:27 874

WORD2VEC.zip

word2vec训练维基中文语料的三个文件,process.py为处理维基中文保存为wiki.zh.text,然后用opencc把繁体化为简体中文wiki.zh.text.jian.txt,然后用fenci_model.py进行分词生成wiki.zh.seg.text.jian.txt,最后用train_word2vec_model.py进行训练

2020-04-14

NamedEntityDisambiguation - test.zip

这份代码属于NLP功能中的实体消歧-共指消解。对输入的一段语句中,指向同一个实体的不同名称进行查找,计算相似度,完成替换。用的是余弦相似度和TFIDF,思路比价简单,方法比较粗糙,但是只要对该实体的desc(描述性语句)够多,效果应该很不错

2020-03-25

QASystemOnHepatopathyKG-master.zip

基于知识图谱和规则的医疗问答系统,从实体创建到资源导入,从问题分类到问题解析,再到SQL查询,一整套完整的代码,经过本人的测试,可以跑通,效果很不错。并且迁移性高,可以根据自己的需求,改写。具体的操作可以看Readmechenghong.txt 里面是我构建实体画像问答的完整过程

2020-03-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除