NLP
陌上半仙儿
念念不忘
展开
-
用Python写简单爬虫
先挖坑,以后填==!原创 2016-03-02 17:41:36 · 321 阅读 · 0 评论 -
autoencoder自动编码器
自动编码器由于工作需要详细学习了autoencoder自动编码器,写此文章做下记录,其中内容大多不是原创,只做了汇总和总结。autoencoder是一种无监督的学习算法,他利用反向传播算法,让目标值等于输入值。 换句话说,它尝试逼近一个恒等函数,从而使得输出 \textstyle \hat{x} 接近于输入 \textstyle x 。恒等函数虽然看上去不太有学习的意义,但是当我们为自编码神经网络原创 2016-07-01 18:27:03 · 713 阅读 · 0 评论 -
关键词提取之TextRank算法
最近工作内容牵涉到文本关键词提取,因此学习了两种比较流行的关键词提取算法tf-idf和TextRank,本文就TextRank算法的学习做一些笔记。原始论文:Rada&Paul, TextRank: Bringing Order into Texts一、PageRankTextRank的思想基本上来源于PageRank。PageRank是Google搜索对结果链接进行排序的算法,其基本思想就是将每个原创 2016-07-01 19:01:04 · 3577 阅读 · 0 评论