![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
songhk0209
百度学术主页 http://xueshu.baidu.com/scholarID/CN-BX8YRS0J
展开
-
LSTM cell结构的理解和计算
LSTM是传统RNN网络的扩展,其核心结构是其cell单元,网上LSTM的相关资料繁多,质量参差不齐,下面主要结合LSTM神经网络的详细推导和 Christopher Olah的blog两篇文章中的内容进行说明。主要介绍网络如何计算,为何这么算先不展开:)。前者一副图加上29个公式,简洁明了;后者娓娓道来,适合初学者。首先是LSTM cell最常见的结构图:这是变形的版本(找不到更清晰的版本了),原创 2017-05-03 18:31:02 · 26701 阅读 · 5 评论 -
新词发现及Java和spark实现
新词发现并不是一个新的课题,但最有意思的一点是如果采用无监督的算法,可以完全脱离人工的经验由算法自动找到有语意的“词语”,而不是胡乱拼凑的汉字片段(归因于算法的有效性和语料本身是由有意义的词语构成的)。本文参考了matrix67的一篇文章,[互联网时代的社会语言学:基于SNS的文本数据挖掘](http://www.matrix67.com/blog/archives/5044),采用无监督方法来发现原创 2017-08-31 11:52:32 · 2182 阅读 · 3 评论 -
Stanford 英文词性标注(Part-of-speech)缩写查询
由于最近项目要用到 英文的词性标注,那Stanford的coreNLP的开源实现肯定是不得不参考的,下面整理给出对应论文中的词性标注缩写及实例:String str = "where/WRB, are/VBP, you/PRP, ?/., I/PRP, want/VBP to/TO, know/VB, you/PRP, soon/RB";原创 2017-10-25 12:51:01 · 5735 阅读 · 1 评论 -
vader —— 一种基于规则的英文文本情感识别方法
之前舆情项目的合作cp方提出有海外舆情监控的需求,原先的舆情系统的大部分功能都可以天然支持非中文语言,唯独在情感识别上,由于中英文语法和词库的不同,需要重新实现英文的情感识别算法。 考虑到现有项目中中文情感识别是基于规则和词库的(对比基于学习模型),基于现有的流式计算框架,决定采用类似的基于规则和词库的方法来实现英文情感识别是更合适的。再查阅了一些相关文献之后,决定基于vader方法原创 2018-04-12 16:46:31 · 16749 阅读 · 3 评论 -
基于词库和规则的中文情感识别方法
buttom-up的方法通常具有较高的稳定性和低的计算复杂度,适合大吞吐量的流式处理。button-up向的情感识别内容如题,分为两块词库和情感识别的语法规则来说明。常用情感词库: 情感识别的语法规则: 主要参考了以下中文情感识别的文献: ...原创 2018-04-13 11:46:56 · 3930 阅读 · 1 评论