NLP
wzdjsgf
haha
展开
-
自然语言处理入门 word2vec 使用tensorflow自己训练词向量
词向量是什么 自然语言理解的问题要转化为机器学习的问题,第一步肯定是要找一种方法把这些符号数学化。 NLP 中最直观,也是到目前为止最常用的词表示方法是 One-hot Representation,这种方法把每个词表示为一个很长的向量。这个向量的维度是词表大小,其中绝大多数元素为 0,只有一个维度的值为 1,这个维度就代表了当前的词。 举个栗子, “话筒”表示为 [0 0 0 1 0 0...原创 2018-03-13 16:09:09 · 2167 阅读 · 2 评论 -
自然语言处理-中文分词
一、中文分词技术1、常见的两类中文分词技术中文分词技术常见的有两大类:机械分词技术、基于统计的序列标注技术。机械分词技术操作简单、方便,比较省心,但是对于歧义词以及未登录词的效果并不是很好;统计模型的序列标注方法,对于识别未登录词拥有较好的识别能力,而且分词精度也比较大,同时这个方法可以不分中文、英语,着重看在语言前后顺序。以下是思维导图的形式展示两大区别:2、深度学习...转载 2018-03-14 13:12:43 · 508 阅读 · 0 评论