Python数据分析的模块概述

最新推荐文章于 2024-05-08 07:56:20 发布

BELLA079

最新推荐文章于 2024-05-08 07:56:20 发布

阅读量683

点赞数

文章标签：数据分析数据挖掘

本文链接：https://blog.csdn.net/BELLA079/article/details/104112266

版权

Python数据分析与挖掘技术概述
所谓数据分析，即对已知的数据进行分析，然后提取出一些有价值的信息，比如统计平均数，标准差等信息，数据分析的数据量可能不会太大，而数据挖掘，是指对大量的数据进行分析与挖倔，得到一些未知的，有价值的信息等，比如从网站的用户和用户行为中挖掘出用户的潜在需求信息，从而对网站进行改善等。
数据分析与数据挖掘密不可分，数据挖掘是对数据分析的提升。数据挖掘技术可以帮助我们更好的发现事物之间的规律。所以我们可以利用数据挖掘技术可以帮助我们更好的发现事物之间的规律。比如发掘用户潜在需求，实现信息的个性化推送，发现疾病与病状甚至病与药物之间的规律等。

预先善其事必先利其器
我们首先聊聊数据分析的模块有哪些：

numpy 高效处理数据，提供数组支持，很多模块都依赖它，比如pandas，scipy，matplotlib都依赖他，所以这个模块都是基础。所以必须先安装numpy。
pandas 主要用于进行数据的采集与分析
scipy 主要进行数值计算。同时支持矩阵运算，并提供了很多高等数据处理功能，比如积分，微分方程求样等。
matplotlib 作图模块，结合其他数据分析模块，解决可视化问题
statsmodels 这个模块主要用于统计分析
Gensim 这个模块主要用于文本挖掘
sklearn，keras 前者机器学习，后者深度学习。
下面就说说这些模块的基础使用。

numpy模块安装与使用
安装：
下载地址是：http://www.lfd.uci.edu/~gohlke/pythonlibs/
我这里下载的包是1.11.3版本，地址是：http://www.lfd.uci.edu/~gohlke/pythonlibs/f9r7rmd8/numpy-1.11.3+mkl-cp35-cp35m-win_amd64.whl
下载好后，使用pip install “numpy-1.11.3+mkl-cp35-cp35m-win_amd64.whl”
安装的numpy版本一定要是带mkl版本的，这样能够更好支持numpy

numpy简单使用
import numpy

x=numpy.array([11,22,33,4,5,6,7,]) #创建一维数组
x2=numpy.array([[‘asfas’,‘asdfsdf’,‘dfdf’,11],[‘1iojasd’,‘123’,989012],[“jhyfsdaeku”,“jhgsda”]]) #创建二维数组,注意是([])

x.sort() #排序，没有返回值的，修改原处的值，这里等于修改了X
x.max() # 最大值，对二维数组都管用
x.min() # 最小值，对二维数组都管用
x1=x[1:3] # 取区间，和python的列表没有区别
生成随机数
主要使用numpy下的random方法。

#numpy.random.random_integers(最小值,最大值

最低0.47元/天解锁文章

BELLA079

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Python数据分析的模块概述

Python数据分析与挖掘技术概述所谓数据分析，即对已知的数据进行分析，然后提取出一些有价值的信息，比如统计平均数，标准差等信息，数据分析的数据量可能不会太大，而数据挖掘，是指对大量的数据进行分析与挖倔，得到一些未知的，有价值的信息等，比如从网站的用户和用户行为中挖掘出用户的潜在需求信息，从而对网站进行改善等。数据分析与数据挖掘密不可分，数据挖掘是对数据分析的提升。数据挖掘技术可以帮助我们更好...
复制链接

扫一扫