NLP自然语言处理
文章平均质量分 74
摸金青年v
帮助值得帮助的人
展开
-
Elsevier期刊的Conflict of Interest Form网址
由于提交Elsevier爱思唯尔的Neurocomputing期刊,必须提交的4个文件中有一项Conflict of Interest Form模板不容易找特此分享此官网链接简要介绍链接:https://service.elsevier.com/app/answers/detail/a_id/286/supporthub/publishing/p/10592/具体下载地址(加载慢)...原创 2020-05-01 20:26:00 · 16347 阅读 · 1 评论 -
斯坦福Stanford Parser句法分析工具使用指南
Stanford官网下载缓慢,分享Stanford Parser2016安装包链接: https://pan.baidu.com/s/1DSwY_Njm_9WQFuNisR30Jw提取码: d6kfStanford Parser图形化操作界面lexparser-gui.bat1. 在windows操作系统下,双击运行软件根目录下的lexparser-gui.bat文件2....原创 2019-10-30 22:53:33 · 3414 阅读 · 0 评论 -
RNN、LSTM和GRU网络原理
RNN(Recurrent Neural Networks)基本模型:RNN计算公式:通过反向传播计算所有W和b。多种RNN:根据实际应用场景的不同,衍生出多种RNN结构两种多对多模型:命名体识别(RNN基本模型Tx=Ty)、机器翻译(encode-decode编码器-解码器)多对一:情感分析 ...转载 2019-02-18 13:52:50 · 538 阅读 · 0 评论 -
CNN经典模型AlexNET、VGG、ResNET总结
1 CNN(Convolutional Neural Networks)卷积神经网络基础卷积和池化的示意图:蓝色矩形:输入尺寸n=5,5x5的图片绿色矩形:输出尺寸计算:(n+2p-f)/s +1 = (5+2x1-3 ) /2 +1 = 2+1= 3 得到3x3的输出动态阴影:过滤器(filter)f=3,3x3的卷积核、步长(stride)...转载 2019-02-22 20:42:15 · 4417 阅读 · 0 评论 -
RCNN、Fast-RCNN图像目标检测
1 什么是目标检测图像处理领域的目标检测(边缘检测)任务:识别出图片中物体的轮廓边缘,定位它们的位置,并用方框框出。RCNN 2014年1 利用选择性搜索方法(Selective Search)选出1000到2000个候选框(感兴趣区域,Region Interest)2 所有候选框缩放至相同大小输入到CNN中3 每个候选框都进行一次卷积,卷积模型选用(A...转载 2019-02-23 08:57:20 · 472 阅读 · 0 评论 -
python内置函数for循环使用range、enumerate
正确使用Python的内置函数 range()允许你通过索引访问数字元素,但我们希望同时获取每个元素的索引和值,更优雅的解决方案使用enumerate()enumerate()可以遍历list、start参数来设置偏移量(修改初始索引)、遍历dic字典、遍历字符串等等。# 要求遍历列表,同时访问索引和值a = ['They','had','published','adv...原创 2019-04-22 07:54:29 · 831 阅读 · 0 评论 -
【自然语言处理】知识图谱简介
知识图谱的由来 计算机一直面临着这样的困境——无法获取网络文本的语义信息。为了让机器能够理解文本背后的含义,我们需要对可描述的事物(实体)进行建模,填充它的属性,拓展它和其他事物的联系,即,构建机器的先验知识。Google为了提升搜索引擎返回的答案质量和用户查询的效率,于2012年5月16日发布了知识图谱(Knowledge Graph)。有知识图谱作为辅助,搜索引擎能够洞...转载 2019-05-11 09:55:04 · 3133 阅读 · 0 评论 -
word2vec自训练词向量(代码+注释+训练过程和结果)
word2vec代码(中文英文都可以训练)import collectionsimport mathimport randomimport zipfileimport numpy as npfrom six.moves import xrangeimport tensorflow as tfdef read_data(filename): with zipfile....原创 2019-05-06 14:59:50 · 9048 阅读 · 14 评论 -
预训练词向量中文维基百科,英文斯坦福glove预训练的词向量下载
中文预训练词向量——基于中文维基百科语料训练英文预训练词向量——斯坦福glove预训练的词向量百度云分享:https://pan.baidu.com/s/1UpZeuqlNMl6XtTB5la53Xw提取码: afhh 维基百科词向量 sgns.wiki.char.bz2解压后文件后缀名是.char, 可以通过一些方法得到.txt结尾的文件,有35万多个字...原创 2019-05-06 11:07:18 · 10614 阅读 · 3 评论 -
语义相似度公开数据集STS、MSRP、SICK 介绍和下载
MSRP、STS、SICK三个句子相似度计算的公开数据集(预处理后便于使用)下载地址百度云:https://pan.baidu.com/s/1y6GoUKfpXKFzDAqpx9k8hQ 提取码: yh6m1、MSRP数据集 Microsoft Research Paraphrase Corpus官方下载网址:https://www.microsoft.com/e...原创 2019-05-06 09:43:19 · 15324 阅读 · 15 评论 -
keras CNN lenet-5和LSTM实现MNIST手写数字识别(代码注释详解)
MNIST手写数字识别数据集(图像识别)数据集包含10个数字的60,000个28x28灰度图像,以及10,000个图像的测试集。如果MNIST数据集无法下载,详见本篇博客提供下载和使用:https://blog.csdn.net/sinat_41144773/article/details/89843688代码实现(CNN卷积、循环神经网络RNN 注释切换)from ...原创 2019-05-05 15:15:30 · 3015 阅读 · 0 评论 -
keras 实现reuters路透社新闻多分类
路透社reuters话题分类 来自路透社的11,228条新闻数据集标有46个主题。与IMDB数据集一样,每条线都被编码为一系列字索引。reuters数据集无法下载,详见本篇博客提供下载和使用:https://blog.csdn.net/sinat_41144773/article/details/89843688代码实现from keras.datasets...原创 2019-05-05 15:06:59 · 1553 阅读 · 3 评论 -
keras LSTM实现imdb电影评论文本二分类
keras 实现IMDB电影评论情绪分类 数据集来自IMDB的2.5万部电影评论,以情绪(正面/负面)标记。评论已被预处理,并且每个评论被编码为一系列词索引(整数)。为了方便起见,词汇通过数据集中的整体频率进行索引,例如整数“3”对数据中第三个最频繁的词进行编码。这允许快速过滤操作,例如:“只考虑前10000个最常用的词,但是排除前20个最常见的词”。作为惯例,“0”不代表特定的...原创 2019-05-05 14:47:45 · 3926 阅读 · 0 评论 -
Keras的imdb和MNIST数据集无法下载问题解决
keras框架为我们提供了一些常用的内置数据集。比如,图像识别领域的手写识别MNIST数据集、文本分类领域的电影影评imdb数据集等等。这些数据库可以用一条代码就可以调用:from keras.datasets import mnistfrom keras.datasets import imdb(x_train, y_train), (x_test, y_test)...原创 2019-05-05 14:33:35 · 9805 阅读 · 36 评论 -
词向量技术Word2vec、Glove、ELMo、BERT的原理及发展趋势
词向量技术的演化方向:Word2vec (2013)——> Glove(2014)(LSA全局共现词+word2vec优点)——> ELMo(2018)——> BERT(2018)发展趋势:词向量表到预训练词嵌入模型的将文本信息中的词语转化为词向量的形式是NLP领域中最基本的上游任务。1 Word2vec 2013 skip-gram模型的基本工作原...原创 2019-02-24 22:14:13 · 1887 阅读 · 0 评论