NLP
文章平均质量分 59
Mr番茄蛋
大家一起学习
展开
-
Python中使用Stanford CoreNLP
前言Stanford CoreNLP的源代码是使用Java写的,提供了Server方式进行交互。stanfordcorenlp是一个对Stanford CoreNLP进行了封装的Python工具包,GitHub地址,使用非常方便。安装依赖1:下载安装JDK 1.8及以上版本。 2:下载Stanford CoreNLP文件,解压。 3:处理中文还需要下载中文的模型jar文件,然后...原创 2018-05-25 14:25:06 · 36426 阅读 · 58 评论 -
知识图谱和 Neo4j 浅析
在当前大数据行业中, 随着算法的升级, 特别是机器学习的加入,“找规律”式的算法所带来的“红利”正在逐渐地消失,进而需要一种可以对数据进行更深一层挖掘的方式,这种新的方式就是知识图谱。下面我们来聊一下知识图谱以及知识图谱在达观数据中的实践。一.什么是知识图谱知识图谱(Knowledge Graph)是一种用点来代替实体,用边代替实体之间关系的一种语义网络。通俗来说,知识图谱就是把所有不同种类的...原创 2019-02-21 13:42:14 · 11937 阅读 · 0 评论 -
使用gensim加载预训练的词向量
使用gensim加载预训练的词向量,并采用谷歌的self-attention方法计算不同词之间的相关性from nltk import word_tokenizes='Concurrent therapy with ORENCIA and TNF antagonists is not recommended'token=word_tokenize(s)print(token)import...原创 2018-10-11 21:15:59 · 9966 阅读 · 4 评论 -
NLTK词性标注POS含有哪些词性?这里总结
NLTK词性: 下面解释可以直接使用nltk.help.upenn_tagset()查看官方英文说明。标记 含义 例子 CC 连词 and, or,but, if, while,although CD 数词 twenty-four, fourth, 1991,14:24 DT 限定词 the, a, some, most,every, no EX 存在量词 there, there’...原创 2018-08-11 22:02:21 · 2927 阅读 · 1 评论 -
LSTM输入输出详解,tensorflow.nn.bidirectional_dynamic_rnn()函数的用法
LSTM结构 参数介绍: 数学原理: 公式参数: xt∈Rdxt∈Rd{\displaystyle x_{t}\in \mathbb {R} ^{d}}: input vector to the LSTM unit ft∈Rhft∈Rhft∈Rhft∈Rh{\displaystyle f_{t}\in \mathbb {R} ^{h}} {\displaystyle f_{t...原创 2018-08-01 16:16:21 · 17764 阅读 · 1 评论 -
实体关系抽取 entity relation extraction 文献阅读总结
这里总结得很好,CIPS青工委学术专栏第3期 | 基于深度学习的关系抽取 http://www.cipsc.org.cn/qngw/?p=890出现的知乎的链接笔记部分是我写的,也有我的同学写的。知乎id: WhiteAndWhite传统的关系抽取方法总结:基于句法解析增强的方法,Milleret al. 2000基于逻辑回归的方法,Kambhatla 2004基于核函数的方法,...转载 2018-07-20 21:38:37 · 3272 阅读 · 0 评论 -
深度学习图片卷积输出大小计算公式
先定义几个参数输入图片大小 W×W Filter大小 F×F 步长 S padding的像素数 P 于是我们可以得出N = (W − F + 2P )/S+1输出图片大小为 N×N原创 2018-07-19 14:20:30 · 1659 阅读 · 0 评论 -
Understanding Convolutional Neural Networks for NLP
When we hear about Convolutional Neural Network (CNNs), we typically think of Computer Vision. CNNs were responsible for major breakthroughs in Image Classification and are the core of most Computer V...转载 2018-07-24 21:12:30 · 319 阅读 · 0 评论 -
NLP文本预处理去除标点符号
from string import punctuationimport reimport sysreload(sys)sys.setdefaultencoding(‘utf-8‘)import codecs# 英文标点符号+中文标点符号punc = punctuation + u‘.,;《》?!“”‘’@#¥%…&×()——+【】{};;●,。&~、|\s::‘...原创 2018-06-27 16:14:43 · 7251 阅读 · 0 评论