精通Python自然语言处理
badapplecn
这个作者很懒,什么都没留下…
展开
-
坑3:1.1.2其他语言文本切分
问题:书上说有情人对英文之外的其他语言执行切分,可以加载它们各自的pickle文件,然后用该语言对文本进行切分,结果我找不到中文的。原因:网上看了下,应该是nltk不太支持中文分词。解决办法:pip install jieba原创 2017-12-19 19:21:40 · 169 阅读 · 0 评论 -
坑1:前言中的代码下载
问题:书上提供的下载示例代码的地址www.packt;pub.com是下不了的,甚至注册都没法完成。原因:大概原因是验证码被和谐掉了。解决方法:代码托管在Github上,从https://github.com/PacktPublishing/Mastering-Natural-Language-Processing-with-Python下载说明:其实也不算太坑,书上也提供了G原创 2017-12-13 12:27:40 · 182 阅读 · 0 评论 -
坑2:1.1.1将文本切分为语句
问题:按如下语句运行,报错。import nltktext="Welcome readers. I hope you find it interesting. Please do reply."from nltk.tokenize import sent_tokenizesent_tokenize(text)错误如下:Traceback (most recent call原创 2017-12-13 12:41:25 · 762 阅读 · 3 评论