自然语言处理是机器学习当前最神秘,最红火,最具难度,也最让引人关注的分支。在搜索
引擎,语音识别,情感分析,大批量文档处理,机器翻译,自动应答等各个领域有着前程无
可限量的应用。
可以试想一台能理解自然语言,
并且和人类能用语言纯熟交流的机器,
那还
能叫机器么?文本挖掘
(Text Mining)
是数据挖掘以及自然语言处理技术衍生的一个分支,
挖掘对象通常是非结构化的文本数据,
常见的文本挖掘对象包括网页所产生的
BBS
留言、
博
客、微博、新闻跟贴与转贴等。此外,拥有大型呼叫中心或邮件系统的企业,
call center
或
积攒下来的大量语言记录也可以通过文本挖掘获得众多具有商业价值的知识。我们
用计算机去处理文字,语音,理解语言,
这些本来是高等生物人类才能做的事情,
使到系统
能产生
“机器也具有人类同样的智慧”
的震惊效果,
无需置疑肯定会给顾客和观众留下极其
深刻的印象。
Python
作为一门主流的编程语言,在自然语言的处理中也是有非常多的应用。那么就让我
们一起来学习怎么使用
Python
进行自然语言处理吧!
课程大纲
第一课:自然语言分析利器——
Python
入门
第二课:自然语言分析工具包——
NLTK