自然语言处理
blank4569
-------------------
展开
-
解决unicodedecodeerror问题
本文转载自abitch的博客在Windows平台下写python最头痛的就是pip不好用,装一个包都能报错,以前懒碰到问题都换linux去做了,现在有空还是要解决一下,先看看错误是啥 用pip安装任何一个包,都提示 UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xbb in position 7: ordinal not in rang...转载 2018-03-29 09:52:22 · 3036 阅读 · 0 评论 -
关于NLP的编码问题的思索
前几天,在尝试通过nltk工具包对唐诗进行一些处理分析的时候,遇到了编码解码方面的错误。错误如下,就是UnicodeDecodeError: 'gbk' codec can't decode bytes in position 738868-738869: illegal multibyte s。很明显,这是编码解码上的错误,于是去度娘那里仔细了解了一下编码解码方面的知识,得到了一个算是一劳永逸的...原创 2018-03-30 15:34:00 · 1790 阅读 · 0 评论 -
统计学习方法 HMM
统计学习方法 第十章 隐马尔可夫模型 习题10.1 后向算法求观测序列O出现的概率P(O|)原创 2018-11-02 19:13:02 · 2162 阅读 · 0 评论 -
Python自然语言处理 NLTK包中的 text3.generate() 命令出错 'Text' object has no attribute 'generate'
《python自然语言处理时》第28页有这样一个命令--text3.generate()---功能是:产生一些与text3风格类似的随机文本。用NLTK3.0.4和Python2.7.6来实现时却出现错误:'Text' object has no attribute 'generate' .探索一下后发现问题所在:打开nltk文件夹中的text.py发现了,原来新版本的NLTK没有了“...转载 2018-11-15 10:54:14 · 1325 阅读 · 0 评论 -
Python下Matplotlib画图中文显示乱码的解决方法
最近使用notebook Python中的matplotlib作图,发现中文设置的坐标标签和title都显示为乱码,用了网上的许多教程都不管用,嘴后解决的方式是设置下述的两行即可搞定: plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签 plt.rcParams['axes.unicode_minus']=False #用来正常显示负号...转载 2018-12-18 02:45:24 · 1095 阅读 · 0 评论 -
从奇异值分解了解潜在语义分析
奇异值分解(SVD)的数学原理以及推导过程http://blog.csdn.net/zhongkejingwang/article/details/43053513奇异值分解(SVD)在潜在语义分析(LSA)上的扩展https://blog.csdn.net/hohaizx/article/details/79918898文本主题模型之潜在语义分析(LSA)https://blog.cs...转载 2019-01-15 10:05:23 · 337 阅读 · 0 评论