python在安装好后,需要安装很多包,本文介绍了博主机器学习相关配置。若在安装过程中pip出现问题及更新pip源,请参考博主的这篇文章。《python中的pip安装问题》
文章目录
numpy
pip install numpy
pandas
pip install pandas
matplotlib
pip install matplotlib
sklean
pip install sklearn
jieba
pip install jieba
tensorflow(CPU)
pip install tensorflow
scipy
pip install scipy
theano
pip install theano
keras
pip install keras
xlrd
pip install keras
seaborn
pip install seaborn
nltk
pip install nltk
在使用之前,需要先通过执行python文件的方式下载nltk的工具和语料库,全部包大小几个G,可以根据自己需要自行选择下载的语料库和模型工具包。
import nltk
nltk.download()
执行上述python文件后,就会启动启动nltk下载器,显示界面如下图。
我们根据自己需要点击自行下载,要自己设置下载目录(Download Directory)。同时在调用的时候,要指定文件的下载路径哦!实例代码如下:
import nltk
nltk.data.path.append('e:/dataset/nltk') # 执行文件路径
# 词性标注
text = nltk.word_tokenize('what does the fox say')
print(text)
print(nltk.pos_tag(text))
gensim
pip install gensim
stanford nlp
pip install stanfordcorenlp
下载Stanford CoreNLP文件和中文语言包访问stanford官网,点击download
https://stanfordnlp.github.io/CoreNLP/
分别下载,下载界面如图
下载后的文件如下图:
解压corenlp。重命名为Stanford CoreNLP,并将中文语言包.jar放入文件夹内。
在python文件中使用,需要注明安装目录。
from stanfordcorenlp import StanfordCoreNLP
nlp = StanfordCoreNLP(r'D:\stanfordNLP 3.9.2\Stanford CoreNLP', lang='zh')
Hanlp
Hanlp原生态是支持java的,python安装步骤如下:
- 安装JDK
- 安装Microsoft Visual C++ Build Tools或者安装组件库(这里博主选择后者)
- 安装pyhanlp
安装JDK这里就不介绍了,安装好后配置下环境变量即可。可以参考
https://jingyan.baidu.com/article/6dad5075d1dc40a123e36ea3.html
安装组件库
在此网站找到对应的库
https://www.lfd.uci.edu/~gohlke/pythonlibs/
看清自己的python版本和电脑是32位还是64位的,对应下载。
然后安装,后面跟的是文件的路径地址。
pip install C:\Users\Think\Desktop\JPype1-0.6.3-cp36-cp36m-win_amd64.whl
安装Hanlp
pip install pyhanlp
测试Hanlp安装是否成功:可以在python的shell中输入下面命令,如果没有报错,就安装成功了。
from jpype import *
startJVM(getDefaultJVMPath(), "-ea")
java.lang.System.out.println("Hello World")
shutdownJVM()
截图
第一运行Hanlp的时候,会自动下载数据哦。在控制台会看到他的下载链接,其中data数据较大,可以在使用下面的链接在浏览器下载,并放到python的目录下D:\python\python36\Lib\site-packages\pyhanlp\static\data-for-1.7.3.zip
运行简单代码:
from pyhanlp import *
print(HanLP.segment("今天开心了吗?"))
pyltp
安装pyltp的时候,使用 pip 安装,各种出错,这里提供一种方法
1.下载pyltp-0.2.1-cp36-cp36m-win_amd64.whl文件,百度云,提取码:1gki
2.切换到下载文件的目录,执行 pip install pyltp-0.2.1-cp36-cp36m-win_amd64.whl
3. 执行
pip install pyltp
入门使用及参考:
安装和使用pyltp
官方文档