1.Opencc-python
今天学习文本分析中偶然想到繁体中文要如何分割的问题,于是联想到将繁体中文先转换为简体中文,查过网上的资料后发现比较好用的是opencc-python,以及下载zh_wiki.py 和 langconv.py,将这两个文件放到python代码所在目录即可。
先来说说后者遇到的问题
因为我只安装了anaconda,没有另外装python,所以没有办法跟着网上的教程进行配置环境,如果装了python的话应该会比较容易一点
opencc-python的问题
原以为这个也挺容易的,没想到也弄了一个下午。如果按照网上教程,不管我在anaconda prompt里还是命令行里利用pip install opencc-python
安装都会报错(提示我的错误是403,这个错误目前还么有看到有解决的办法),别灰心
我在GitHub上找到了正确的打开方式!!!
原来,开发这个库的作者将安装代码更新了!立马打开anaconda prompt运行,安装成功!!而且opencc-python 能在Python2.7 和Python3.x.运行,感动天地!!安装代码如下:
pip install opencc-python