![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
精通Python自然语言处理
badapplecn
这个作者很懒,什么都没留下…
展开
-
坑3:1.1.2其他语言文本切分
问题:书上说有情人对英文之外的其他语言执行切分,可以加载它们各自的pickle文件,然后用该语言对文本进行切分,结果我找不到中文的。 原因:网上看了下,应该是nltk不太支持中文分词。 解决办法: pip install jieba原创 2017-12-19 19:21:40 · 181 阅读 · 0 评论 -
坑1:前言中的代码下载
问题:书上提供的下载示例代码的地址www.packt;pub.com是下不了的,甚至注册都没法完成。 原因:大概原因是验证码被和谐掉了。 解决方法:代码托管在Github上,从https://github.com/PacktPublishing/Mastering-Natural-Language-Processing-with-Python下载 说明:其实也不算太坑,书上也提供了G原创 2017-12-13 12:27:40 · 189 阅读 · 0 评论 -
坑2:1.1.1将文本切分为语句
问题:按如下语句运行,报错。 import nltk text="Welcome readers. I hope you find it interesting. Please do reply." from nltk.tokenize import sent_tokenize sent_tokenize(text) 错误如下: Traceback (most recent call原创 2017-12-13 12:41:25 · 776 阅读 · 3 评论