最近老师布置了一个CNN神经网络的任务,词向量得到的原理和卷积神经网络工作的原理已经讲过了,现在主要安装scikit-learn工具,利用TF-IDF方法来得到词向量。在网上也发现了不少st-learn工具的安装教程,不过还是有点乱,自己整理一下,能帮助别人的话更好啦。
首先,安装SK-Learn需要依赖的Python安装包有:
Python (>= 2.6),
NumPy (>= 1.3),
SciPy (>= 0.7),
第一步:
我的计算机是WIN 10 64bit的系统,安装的Python是Python 2.7.12(64 bit),看到很多文章说要安装pip,easy_install,不过这个版本的python中的script文件夹中就已经有这两个命令了,我没有安装,也成功安装了st-learn工具。下载python,https://www.python.org/downloads/windows/,一步步安装,然后把安装路径(C:\Python27;C:\Python27\Scripts)添加到环境变量。验证方式就是打开cmd,输入python即可。
第二步:
安装剩下的两个包,我采取的是手动下载安装的方式,直接用命令安装的话很容易出现版本不一致的问题,我就是numpy安装成功,但是scipy是失败的。后来改为手动安装,成功安装了这两个包,具体方法见下:
首先安装wheel,在cmd输入 pip install whee即可。
安装numpy。进入http://www.lfd.uci.edu/~gohlke/pythonlibs/,找到numpy-1.10.4+mkl-cp27-none-win_amd64.whl,下载到本地,比如我下载到了I:\downloads\stlearn这个文件夹。在cmd中进入这个文件夹输入:pip install "压缩文件名"即可。
安装scipy同理:
推荐安装下面的matplotlib包,因为画图必须要用:
第三步:
安装st-learn工具,可以手动安装,也可以使用命令安装,我是使用命令安装的:
easy_install scikit_learn
安装成功,那么如何检验工具是否安装成功呢,可以在scikit-learn官网上下载源码进行执行:
测试http://scikit-learn.org/stable/auto_examples/linear_model/plot_ols.html#example-linear-model-plot-ols-py,下载源码运行,得到结果: