TextCNN是否忽略了词的顺序?

想请教个问题: TextCNN在convolution操作后会有max pooling的操作,如果把不同的convolution操作看作是提取不同的特征,所有的convolution都是对整个句子进行的,那max pooling之后是不是就完全失去了句子的顺序? 希望有人指点一二,感恩 ...

2019-04-22 17:55:55

阅读数 40

评论数 4

为什么说BERT是bidirectional

BERT是一个deep bidirectional Transformer。 Transformer可参考 https://baijiahao.baidu.com/s?id=1622064575970777188&wfr=spider&for=pc 非常详细易...

2019-04-19 20:55:19

阅读数 43

评论数 0

如何理解word2vec中的NCE

以下是自己的一些想法和提问,不一定正确,还望大家指正,感恩! word2vec为什么使用NCE? 使用NCE来替代softmax, 是因为softmax在类别很多很多的时候计算量大(计算每个类的得分的时候都需要对所有类求和来做分母),word2vec最后需要输出词表大小的类别,数量很大。NCE...

2019-04-17 20:59:47

阅读数 40

评论数 0

一个LSTM层中隐向量的个数怎么理解

参考 https://www.reddit.com/r/MachineLearning/comments/87djn7/d_what_is_meant_by_number_of_hidden_units_in_an/ LSTM有input gate, forget gate, output ga...

2019-04-16 21:59:41

阅读数 572

评论数 0

html 换行

使用django编写网页项目,当文本参数传入html时,<br>在网页上仍然显示为<br>,没有换行。 解决方法: 在.html文件中,将 {{error_message}} 重新写成 {{error_me...

2018-09-18 17:15:10

阅读数 2128

评论数 0

sklearn CountVectorizer 单字

在使用python sklearn.feature_extraction.text的CountVectorizer时,发现会自动剔除掉单字的中文和只有一个字母的英文。 #CountVectorizer convert a collection of text documents to a ma...

2018-09-13 11:41:01

阅读数 413

评论数 0

命名实体识别(biLSTM+crf)

本文是翻译的github这个项目的博客https://guillaumegenthial.github.io/sequence-tagging-with-tensorflow.html。 为什么要用biLSTM?为了使特征提取自动化。当使用CRF++工具来进行命名实体识别时,需要自定义模板(或者...

2018-08-31 09:17:26

阅读数 8271

评论数 3

rasa 中文聊天机器人

环境:ubuntu 16.04 主要是运行github项目https://github.com/zqhZY/_rasa_chatbot ,用来回答一些手机通信业务,项目里面有训练集。 如有问题,期待大家指正,非常感谢! 1.Rasa介绍 rasa是开源的工具,包括rasa core和ras...

2018-08-31 08:52:38

阅读数 4744

评论数 7

tensorflow多次restore模型出错

环境:python3,tensotflow 在恢复了预先训练好的模型进行预测时,第一次是能够成功执行的,但我多次restore模型时,出现了以下问题: 1.ValueError: Variable char_embed/char_embedding already exists, disall...

2018-08-23 17:18:57

阅读数 2078

评论数 0

word2vec skip-gram

翻译了http://mccormickml.com/2016/04/19/word2vec-tutorial-the-skip-gram-model/这个链接下介绍skip-gram的word2vec。如有错误,望大家指出,非常感谢! 这篇教程涵盖了word2vec的skip-gram神经网络结...

2018-08-02 19:52:27

阅读数 592

评论数 0

神经网络 backpropagation

这是很早之前看到的cs224n lecture note 3中一篇文章,当时翻译了一部分,没有翻译完,现在好像找不到了。觉得这篇文章对理解后向传播很有用,分享一下。如有问题,还望大家指出,非常感谢! 这部分介绍单层和多层神经网络,以及它们如何用于分类,并介绍如何使用分布的梯度下降(distrib...

2018-07-20 11:18:15

阅读数 475

评论数 0

K-Competitive Autoencoder for Text

对论文https://arxiv.org/pdf/1705.02033.pdf中的模型部分进行记录尽管自编码器的目标是最小化reconstruction error,我们的目标是从数据中提取出有意义的特征。相比于图片数据,文本数据对自编码器更有挑战,因为文本数据高维,离散,幂律词分布。当检验用自编...

2018-07-10 20:36:27

阅读数 326

评论数 0

uwsgi http socket

在使用uwsgi+django发布网页时,如何生成uwsgi.sock文件?在uwsgi运行的配置文件ini中,添加:socket=/home/hadoop/PycharmProjects/wxtbr/uwsgi.sock

2018-07-04 17:49:16

阅读数 1514

评论数 0

tf.gather

tf.gather(params, indices, validate_indices=None, name=None, axis=0) Gather slices from `params` axis `axis` according to `indices`. 从'params'的'axis...

2018-06-15 08:54:33

阅读数 7263

评论数 2

tensorflow 部分预处理函数

tf.split(value, num_or_size_splits, axis=0, num=None, name='split')将tensor拆分为新的tensor如果'num_or_size_splits'是一个整数'num_split',就把'value'沿着'axis'所在的维拆分成'...

2018-06-10 16:39:57

阅读数 290

评论数 0

python hanlp

想要在python中调用hanlp进行中文实体识别,Ubuntu 16.04的系统环境1. 安装jpype1,在cmd窗口输入pip install jpype12. 下载hanlp的安装包在https://github.com/hankcs/HanLP/releases         (1)....

2018-05-25 17:54:03

阅读数 1682

评论数 0

ubuntu 16.04 无法连接wifi

在ubuntu 16.04 LTS显示不出来任何Wifi,也就没法连接Wifi。按网上的方法,设置 "software & updates"的“Additional Drivers”为using,但仍然无效。在命令窗口输入发现Hard b...

2018-04-08 19:46:13

阅读数 398

评论数 0

stanford parser 中文 出错 UnicodeDecodeError

win7+python3.4+nltk调用stanford parser对中文进行语法解析。有些句子成功解析,有些句子会报错,报错如下:UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 96-97: invalid c...

2018-02-28 18:01:53

阅读数 116

评论数 0

python已存在的excel中新增表,不覆盖原数据

每月需更新某个excel表格,进行两项操作,且不覆盖原有的sheet:1. 在原来的excel表中新增sheet2. 往原有的excel表中的某张sheet新增内容基于python3,使用xlrd,xlwt,具体代码如下,亲测有效,希望对大家有帮助,谢谢!import xlwt import xl...

2018-02-14 10:40:14

阅读数 7634

评论数 2

访问阿里云服务器上的neo4j

在阿里云服务器上启动了neo4j,想让所有用户可以通过服务器IP来访问neo4j。

2017-12-20 14:45:02

阅读数 1281

评论数 1

提示
确定要删除当前文章?
取消 删除
关闭
关闭