Python 数据挖掘(一) 模块安装部署 numpy等

1.数据挖掘模块说明

(1)numpy模块

高效处理数据、提供数组支持、很多模块都依赖他,比如pandas、scipy、matplotlib都依赖他,所以这个模块是基础。建立起功能与模块名的依赖关系

(2)pandas模块

主要用于进行数据探索和数据分析,用的频率会比较高。

(3)matplotlib模块

是一个作图模块,解决可视化问题。

(4)scipy模块

主要进行数值计算,同时支持矩阵运算,并提供了很多高等数据处理功能,比如积分、傅里叶变化、微分方程求解等。

(5)statsmodels模块

主要用于统计分析

(6)Gensim模块

主要用于文本挖掘

(7)sklearn模块

机械学习

(8)keras模块

深度学习

2.下载

下载网址:https://www.lfd.uci.edu/~gohlke/pythonlibs/

下载网址:https://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy

3.安装

模块安装的顺序与方式建议如下:(出错概率比较小)同时安装

1、numpy、mkl(下载安装) 包的名字numpy-1.12.0b+mkl-cp35-cp35m-win_amd64.whl

2、pandas(网络安装)直接只用pip安装

3、matplotlib(网络安装)

4、scipy(下载安装)

5、statsmodels(网络安装)

6、Gensim(网络安装)

保证你的环境安装了python需要配置环境变量(用的python版本是3.5)

使用的命令行:

pip install numpy-1.12.0b+mkl-cp35-cp35m-win_amd64.whl

pip install pandas

pip install matplotlib

pip install scipy-0.18.1-cp35-cp35m-win_amd64.whl

pip install statsmodels

pip install gensim

全部安装之后,运行pip list命令,就可以查看安装完成的库

pip list

 4.常见问题

如果同时安装了python2和python3的用户执行python命令可能会执行python2的命令

查看python的版本:在cmd下执行Python命令查看版本

如果出现的版本是2.X的版本,解决办法:

可以在环境变量中把2.X的环境变量剔除,只留下python3.x的即可

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值