作者前言:
什么是Pycorrector?
说一千道一万,抛去废话,它就是一个中文文本纠错工具,基于Kenlm模型
所以,如果想玩PyCorrector,前提就是要pip这个Kenlm,但!是!网上一堆尤里复制人的教程说一千道一万翻来覆去都是一样的东西(这很csdn),在我win11的环境下,看着这些尤里复制人教程加各种踩坑试错,最后终于成功安装上Pycorrector,下面就是我的一些配置安装心得。
安装过程:
计算机环境:Windows 11
Python版本:3.10.7
一些安装需要的组件:GIT,Anaconda3,Microsoft Visual C++ 14.0
首先,按照网上的资料,我们需要pip install一些包,
按照我当时安装的顺序为一下几个
module | 安装命令 |
---|---|
numpy | pip3 install numpy |
torch | pip3 install torch |
torchvision | pip3 install torchvision |
tensorboard | pip3 install tensorboard |
matplotlib | pip3 install matplotlib |
pillow | pip3 install pillow |
selenium | pip3 install selenium |
requests | pip3 install requests |
版本多少是无所谓的,至少我是没有选择特定版本,运行也没有冲突(前提是你得有一些基础的包,例如什么setuptools之类的,但是如果是这种包没有都会报错提示,pip install就完事了)
然后就是重头戏,Kenlm的安装,网上搜寻资料,我目前觉得靠谱的方式就是本地安装,
网上类似什么
//没用
pip install pypi-kenlm
//更是重量级
pip install kenlm
这种,就不需要试了,基本上是搞不定的,这里推荐两种一种是我前面说的直接本地安装,在
https://github.com/kpu/kenlm/archive/master.zip
上下载下来后,找个没有中文空格的路径解压,在根目录下会看到一个setup.py的文件,直接cmd执行
python setup.py install
然后等就完事了,大概率是没毛病的,有毛病无非两种
1、你有什么包没下,这种都是小问题,老规矩 pip install就行
2、报c++相关错,这个问题解决方案网上一抓一大把,基本上就是一些文件复制操作,故不再此赘述
如果你走到这一步,恭喜,你已经完成90%了,
剩下的就是pip 3个东西
1、jieba
2、pypinyin
3、(主角)pycorrector
至此,安装工作基本上是完成了,也不会出一些逆天的问题的,基本上就是有些包没下。
然后我们就可以愉快的用PyCharm跑一个小demo P.s.记得配置Python Interpreter哦!
下面就是我用网上案例跑出来的结果