NLP情感分析
骑着蜗牛逛世界
只当个人学习记录之用
展开
-
3、 NLP基本问题与模型
词性标注:分词和语言模型文本分类器文本相似度计算局限性:原创 2018-09-18 16:20:06 · 531 阅读 · 0 评论 -
4、 word embedding和文本分类、RNN和文本生成
CNN模型与优化TextCNN上式的级联会发生梯度弥散的现象RNN文本生成上面梯度弥散不容易克服,所以以后使用LSTM ...原创 2018-09-18 16:52:09 · 883 阅读 · 0 评论 -
5、序列标注,机器翻译
LSTM基于LSTM的序列标注双向LSTM机器翻译GRU更新门:重置门:编码器解码器集束搜索算法 ...原创 2018-09-18 17:52:37 · 384 阅读 · 0 评论 -
第一章:爬虫
获取网页默认编码保存我们读取到的网页内容内容总结:xpath解析html 选取节点 scrapy框架scrapy项目创建、Vim items.py要抓取的内容spider爬虫编写、scrapy文本解析:抽取网页中的标题...原创 2018-09-13 17:05:46 · 141 阅读 · 0 评论 -
第二章:关键词与文章相似度
BeautifulSoup查看结构把html转换成字符串,提取字符串中的内容中文分词介绍jieba分词自定义词典与词性当创新办和云计算识别不出来时,外加字典当不知道往字典中加入新词设置多大频率时,可以参考suggest,tag是词性的意思删除词...原创 2018-09-13 20:38:04 · 2359 阅读 · 0 评论 -
paddle词向量的表示
Word2vec算法词频出现的越多,越接近根节点参数更新不仅要更新0,还要更新输入Xword2vecDOC2Vec ...原创 2018-09-25 16:33:20 · 490 阅读 · 0 评论