自然语言处理

好像有时候会用到自然语言处理。

包括一些概念性东西和知识整理。


我爱公开课,有一些公开课的资料整理。

http://52opencourse.com/


知乎上面整理的自然语言入门的知识贴

http://www.zhihu.com/question/19895141


这个是数据竞赛的网站,有一个情感分析的题? 

https://www.kaggle.com/solutions/competitions


公开课程资料 

coursera上面有一个哥伦比亚

https://www.coursera.org/course/nlangp

这里介绍自然语言处理的应用在于语言的自动翻译,人机对话,信息提取(从非结构数据到结构数据)。NLP的基础问题包括在自然语言领域里面建立标准化模型,设计算法来实现这些模型。这个课程学习自然语言的数学化和计算化,其中的机器学习方法包括隐马尔卡夫模型, hidden Markov models, 概率上下文无关语法 probabilistic context-free grammars,  log-linear models, and statistical models for machine translation. 

1. Language modeling.
2. Hidden Markov models, and tagging problems.
3. Probabilistic context-free grammars, and the parsing problem.
4. Statistical approaches to machine translation.
5. Log-linear models, and their application to NLP problems.
6. Unsupervised and semi-supervised learning in NLP.


还有斯坦福的公开课

http://52opencourse.com/49/%E6%96%AF%E5%9D%A6%E7%A6%8F%E5%A4%A7%E5%AD%A6%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86%E5%85%AC%E5%BC%80%E8%AF%BE%E8%AF%BE%E4%BB%B6%E6%B1%87%E6%80%BB


文本挖掘和分析 公开课

https://www.coursera.org/course/textanalytics

This course will be covering the following topics:

  • Overview of text mining and analytics
  • Natural language processing and text representation
  • Word association mining 
  • Topic mining and analysis with statistical topic models
  • Text clustering and categorization 
  • Opinion mining and sentiment analysis   介绍了两种,一种是Ordinal Logistic Regression 另外一种是 Latent Aspect Rating Analysis
  • Integrative analysis of text and structured data


还有一些名字概念啥的,

wordnet  http://www.cnblogs.com/XBWer/p/3854440.html

 WordNet是一个由普林斯顿大学认识科学实验室在心理学教授乔治·A·米勒的指导下建立和维护的英语字典。开发工作从1985年开始,从此以后该项目接受了超过300万美元的资助(主要来源于对机器翻译有兴趣的政府机构)。

  由于它包含了语义信息,所以有别于通常意义上的字典。WordNet根据词条的意义将它们分组,每一个具有相同意义的字条组称为一个synset(同义词集合)。WordNet为每一个synset提供了简短,概要的定义,并记录不同synset之间的语义关系。


lemma 

POS 是标签,


stopwords

http://www.lextek.com/manuals/onix/stopwords1.html


情感分析

这篇博文做了一些整理,可以看看。http://blog.csdn.net/Erli11/article/details/23918751

上面链接里面有一个  Sentiment Symposium Tutorial  http://sentiment.christopherpotts.net/index.html 

基础资料 推荐阅读的论文。

Bing Liu, Sentiment analysis and opinion mining, Morgan & Claypool Publishers, 2012.
•Bo Pang and Lillian Lee, Opinion mining and sentiment analysis, Foundations and Trends in Information Retrieval 2(1-2), pp. 1–135, 2008.
•Hongning Wang, Yue Lu, and ChengXiang Zhai, Latent aspect rating analysis on review text data: a rating regression approach. In Proceedings of ACM KDD 2010, pp. 783-792, 2010. DOI=10.1145/1835804.1835903
•Hongning Wang, Yue Lu, and ChengXiang Zhai. 2011. Latent aspect rating analysis without aspect keyword supervision. In Proceedings of ACM KDD 2011, pp. 618-626. DOI=10.1145/2020408.2020505



相关博文整理:

自然语言处理的一些工具 http://blog.csdn.net/artemisrj/article/details/50813031

用pattern进行自然语言处理

python进行词性分析


  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值