![](https://img-blog.csdnimg.cn/20191014130112613.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
python数据分析常用模块
大鹏的编程之路
既然选择远方,便只顾风雨兼程
展开
-
numpy下载与安装
numpy下载与安装大鹏也是在尝试好几次才安装才安装成功1.首先pycharm尝试没有成功,大致就是点击 文件----》设置----》projiect interpreter点击+进行安装 这种方法失败率非常高,我安装的包没有成功过,用这种方法 哈哈哈2.通过cmd命令窗口安装,安装成功率百分百首先自己得安装好pip包,具体配置流程可百度,很简单输入按WIN键+R键,输入cmd,点击...原创 2019-09-09 10:39:27 · 37164 阅读 · 4 评论 -
Pandas安装下载和 Matplotlib安装下载
安装Pandaspython的pandas模块和numpy模块都是用于科学计算的模块。我看了很多pandas安装的教程,都有一些前提条件:什么numpy的版本要新、要下什么python的什么包啊,先下载镜像啊,网速要好(这个的确是的)这些的,五花八门的,但是我就是先下了python、pip模块、numpy然后用命令行输入命令下载的pip intall Pandas安装 Matplotlib...原创 2019-09-09 11:17:07 · 1960 阅读 · 0 评论 -
Jupter notebook工作文件夹路径修改
Jupter notebook工作文件夹路径修改打开 Anaconda Prompt,并输入jupyter notebook --generate-config下图需要输入y,表示系统已经写过jupter notebook的配置文件第一次输入,命令不需要输入任何东西注意不要重复重写,不然jupyter又会回到默认工作文件夹2.找到该文件其默认存的路径为:C:\Users\Ad...原创 2019-09-24 20:19:18 · 402 阅读 · 0 评论 -
numpy基础操作
numpy基础操作数据结构数组和向量import numpyvector=numpy.array([5,10,15,20]) #向量A=numpy.array([[1,2],[4,4]]) #数组#打印维度print(vector.shape)print(A.shape)# (4,)# (2, 2)#numpy数组要求传入的值都是同一类型print(A.dtyp...原创 2019-09-09 16:27:13 · 354 阅读 · 0 评论 -
matplotlib数据可视化基础(1)
matplotlib基础绘图函数功能函数功能figure.add_subplot创建选中资图,指定行数列数和子图编号plt.figure创建空话不,指定大小和像素plt.xlable(ylabel)添加x(y)轴名称,指定位置,颜色,字体的大小plt.xlim(ylim)指定x(y)轴范围,只能确定一个数值区间,而无法使用字符串标识plt.xt...原创 2019-09-20 11:28:12 · 305 阅读 · 0 评论 -
matplotlib数据可视化基础(2)
matplotlib数据可视化基础(2)绘制直方图直方图又称质量分布图,是统计报告图的的一种,用直方图能够置换的看出产品质量的分布状态,已经总体质量的分布情况。基本语法如下:matplotlib.pyplot.bar(left,height,width=0.8,bottom=None,hold=None,date=None,**kwargs)参数名称说明left接受数...原创 2019-09-23 11:26:15 · 336 阅读 · 0 评论 -
pandas统计分析基础(1)
pandas统计分析基础(1)导入数据import pandas as pddate=pd.read_excel('meal_order_detail.xlsx')print('数据的所有值为:\n',date.values)数据的所有值为: [[2956 417 610062 ... nan 'caipu/104001.jpg' 1442] [2958 417 609957 ...原创 2019-09-24 14:14:15 · 758 阅读 · 0 评论 -
pandas统计分析基础(2)
pandas统计分析基础(2)pandas描述性统计方法的常见方法:方法统计含义方法统计含义min最小值max最大值mean均值count非空数目median中位数mode众数std标准差var方差cov协方差ptp极差skew样本偏度kurt样本峰度sem标准误差quantile四分位数.原创 2019-09-24 15:06:08 · 416 阅读 · 0 评论 -
pandas统计分析基础(3)
pandas统计分析基础(3)使用groupby方法拆分数据本节内容属于同一个程序,在同一个文件中运行DateFrame.groupby(by=None,axis=0,level=None,as_index=True,sort=True,group_key=True,squeeze=False,**kwargs)by=None 进行分组的依据axis=0,操作的纵向,默认对列操作,默认值...原创 2019-09-24 17:36:40 · 778 阅读 · 0 评论 -
数据预处理之数据合并(基于pandas)
数据预处理数据预处理主要包括:数据合并:通过堆叠合并和主键合并等多种合并的方式可以将关联的数据信息合并在同一张表格中数据清洗:对数据进行检测,查询是否有重复值,缺失值和异常值,并对这些数据进行处理标准化数据:为了消除特征之间量纲和取值范围造成的影响,需要对数据进行标准化处理,也可以称作规范化处理转换数据:对经过前面处理的数据进行合理的转换,使其符合分析的要求数据合并:通过堆叠合并和主键...原创 2019-09-26 22:08:46 · 2440 阅读 · 2 评论