自然语言处理理论书籍很多,讲实际操作的不多,能讲的这么系统的更少。Python语言在做NLP方面有较明显的优势。之前国外有《Natural Language Process with Python》,国内热心网友将其翻译为中文版。从这个角度讲,本书是目前世界上最好的自然语言处理实践教程。初学者若在看过理论之后能精读本书,必定会有获益。这也是翻译本书的目的之一。通过使用Python程序设计语言和自然语言工具包(NTLK)的开源库,本书将帮助你增加自然语言处理的实际经验。如果你对开发Web应用、分析多语言的新闻源或编制濒危语言感兴趣,或者只是想要从程序员的视角看人类语言如何运作,你将发现本书不仅有趣而且极其有用。
python自然语言处理目录
第1章 语言处理与Python
1.1 语言计算:文本和词汇
1.2 近观Python:将文本当做词链表
1.3 计算语言:简单的统计
1.4 回到Python:决策与控制
1.5 自动理解自然语言
1.6 小结
1.7 深入阅读
1.8 练习
第2章 获得文本语料和词汇资源
2.1 获取文本语料库
2.2 条件频率分布
2.3 更多关于Python:代码重用
2.4 词典资源
2.5 WordNet
2.6 小结
2.7 深入阅读
2.8 练习
第3章 处理原始文本
3.1 从网络和硬盘访问文本
3.2 字符串:最底层的文本处理
3.3 使用Unicode进行文字处理
3.4 使用正则表达式检测词组搭配
3.5 正则表达式的有益应用
3.6 规范化文本
3.7 用正则表达式为文本分词