自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

摆渡者

我愿做你的摆渡者,即使只能把你送到岸

  • 博客(7)
  • 资源 (1)
  • 收藏
  • 关注

转载 斯坦福CS课程列表

http://exploredegrees.stanford.edu/coursedescriptions/cs/CS 101. Introduction to Computing Principles. 3-5 Units.Introduces the essential ideas of computing: data representation, algorithms, prog...

2018-12-25 20:03:57 12123

原创 TextBlob简介

TextBlob是一个用python编写的开源的文本处理库,它可以用来执行很多自然语言处理的任务,比如,词性标注、名词性成分提取、情感分析、文本翻译等等git 网址:https://github.com/sloria/TextBlob官方文档:https://textblob.readthedocs.io/en/dev/安装:pip install textblob貌似是针对英文进...

2018-12-24 15:03:58 16991 6

原创 FoolNLTK简介

foolnltk是一个基于深度学习的中文分词工具1、特点:基于BiLSTM模型训练而成包含分词、词性标注、实体识别,都有比较高的准确率用户定义词典知乎网址:https://www.zhihu.com/search?type=content&q=FoolNLTK%E7%AE%80%E4%BB%8Bgit 网址:https://github.com/rockyzhengwu/F...

2018-12-24 14:21:56 2482

原创 gensim调用doc2vec计算句子的向量

在做句子的相似度时,会想到直接将句子表示成向量的形式,这样就可以将相似度计算的问题转换成两个向量之间的距离问题,网上找了一下发现,在gensim中的doc2vec可以实现将句子转换成向量,具体的代码如下所示:# coding:utf-8import jiebaimport gensimfrom gensim.models.doc2vec import Doc2VecTaggeded...

2018-12-21 19:21:38 5570 3

原创 ValueError:Dimension must be equal ,but for rnn_layer/bidirection_rnn/fw/fw/while/fw/multi_rnn_cell/

具体的错误类型如下图所示 修改之前的代码是:  def blstm_layer(self, embedding_chars): with tf.variable_scope('rnn_layer'): cell_fw, cell_bw = self._bi_dir_rnn() if self.num_laye...

2018-12-18 16:58:51 475

转载 BERT相关论文、文章和代码资源汇总

BERT最近太火,蹭个热点,整理一下相关的资源,包括Paper, 代码和文章解读。1、Google官方:1) BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding一切始于10月Google祭出的这篇Paper, 瞬间引爆整个AI圈包括自媒体圈: https://arxiv.org...

2018-12-17 19:43:50 1198

原创 BERT中文实战---命名实体识别

我一直做的是有关实体识别的任务,BERT已经火了有一段时间,也研究过一点,今天将自己对bert对识别实体的简单认识记录下来,希望与大家进行来讨论BERT官方Github地址:https://github.com/google-research/bert,其中对BERT模型进行了详细的介绍,更详细的可以查阅原文献:https://arxiv.org/abs/1810.04805bert可...

2018-12-17 14:20:21 36964 39

中文句子向量生成代码

利用现有的python自带的包gensim调用doc2vec进行词向量生成,向量的维度可以自己指定,代码主要是针对中文进行处理的,自己给定训练语料,然后调用该代码可以实现对每一个句子直接给出指定维度的向量

2018-12-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除