自然语言处理
顽强的小豆子
逆风的方向,更适合飞翔
展开
-
中文分词器分词效果的评测方法
转载请注明出处:http://www.codelast.com/现在有很多开源的中文分词器库,如果你的项目要选择其一来实现中文分词功能,必然要先评测它们的分词效果。如何评测?下面详细叙述。【1】黄金标准/Golden standard所谓的黄金标准是指:评价一个分词器分词结果的好坏,必然要有一份“公认正确”的分词结果数据来作为参照。通常,我们使用一份人工标注的数据作为黄金标准。但是,...转载 2018-08-19 22:20:37 · 2424 阅读 · 0 评论 -
自底向上构建知识图谱
转自: https://mp.weixin.qq.com/s/lBeV6XWzk5bqNGiIMok-zw“The world is not made of strings , but is made of things.”——辛格博士,from Google. 知识图谱,是结构化的语义知识库,用于迅速描述物理世界中的概念及其相互关系,通过将数据粒度从document级别降到da...转载 2018-11-09 14:46:47 · 435 阅读 · 0 评论 -
查看tensorflow版本信息
1.输入cmd进入控制台2.输入python3.输入import tensorflow as tf 和 tf.__version__4.如果想要查看tensorflow所在文件夹可以用tf.__path__原创 2018-11-08 15:55:42 · 21838 阅读 · 0 评论 -
BiLSTM-CRF在命名实体识别中作用
LSTM作用:LSTM又叫长短时记忆网络,用来记忆文章的上文关系。CRF作用:通过前面出现的几个词预测下一个可能出现的词。BiLSTM-CRF作用:先说一下LSTM,LSTM模型神经元信息只能从前向后传递,也就意味着,当前时刻的输入信息仅能利用之前时刻的信息。然而对于序列标注任务来说,当前状态之前的状态和之后的状态应该是平权的。命名实体的标签之间具有强烈的依赖关系,BiLSTM...原创 2018-11-26 11:17:22 · 1788 阅读 · 0 评论 -
语言模型的作用
语言模型作用用来计算一个句子(词序列)出现的概率模型。一个长度为n的句子S可以用次序列W1,W2,...,Wn表示。那语言模型就是求这个词序列S的概率P(W)=P(W1,W2,...,Wn)。...原创 2018-11-29 16:40:54 · 2034 阅读 · 0 评论 -
词向量的作用
为了描述词与词之间的相似程度而构建的高维向量,而视频,音频数据构建本身意义,可以直接通过数据进行描述图像与声音的相似度。原创 2018-11-26 21:41:03 · 3700 阅读 · 0 评论