自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 正态分布与威布尔分布图-matplotlib

正态分布图正态分布图简介正态分布是连续随机变量概率分布的一种,自然界、人类社会、心理和教育中大量现象均按正态形式分布;正态分布有两个参数,即期望(均数)μ和标准差σ;在日常分析中经常需要绘制正态分布图来查看数据的分布范围,参数均值和标准差也是重要的参考指标。在用python的matplotlib绘制正态分布图时,一般包含两个部分:一是根据观测数据的区间段划分后绘制的频数分布直方图;二是根据数据特征拟合绘制的正态分布曲线。除了用到matplotlib库以外,还需要用到科学计算库scipy。绘制正态分布

2021-03-25 11:21:36 3565 8

原创 matplotlib绘制风能玫瑰图

概述在之前的风资源分析文章中,有提到过用widrose包来进行玫瑰图和威布尔分布图的绘制,目前的可视化绘图包有很多,但是最基础和底层的,本人认为还是matplotlib,有时候为了画1-2个图就去安装一个包,好麻烦,我就是个安装软件的渣渣,所以,推己及人,我也研究了一下,matplotlib画玫瑰图和威布尔分布图的方法,废话不多说,开始咯~~~...

2021-03-24 14:38:44 2326 8

原创 关于time模块使用

在日常使用python中,会遇到很多时间转化的问题,python中时间的格式有很多种,

2021-03-17 09:51:14 730 7

原创 干货!数据分析报告之风资源分析(2)

这篇文章紧接着上一篇《干货!数据分析报告之风资源分析(2)》,由于分析的角度和涉及的内容太多了,因此分为1和2两篇。在上一篇中,主要介绍了绘图前期的数据预处理,可视化展示的直方图,威布尔分布图,散点图和玫瑰图,接下来继续进行分析。风能玫瑰组图在平时的应用中,多是采用单个的玫瑰图来进行分析,在本次的分析中,我用了风能玫瑰组图,按照不同的月份来进行玫瑰图区分,看风能的月份变化情况。import matplotlib.cm as cmimport numpy as nplabel=['E','','

2021-03-04 14:49:05 632

原创 干货!数据分析报告之风资源分析(1)

风速分析概述根据测到的部分时间的风速,对测到的各个量进行剖析,了解风速风向,发电量等的特性,本文是一片完整的分析报告,从数据初步处理,到时间的处理,再到数据的多角度可视化,包含多子图,组图,玫瑰图等等,所使用的库需要提前安装。数据预处理...

2021-02-24 15:13:55 1966 6

原创 数据预处理之空值与异常值处理

在大部分的数据分析里面,直接获取的数据都会存在一些问题,比如缺失值,异常值等,在进行深度分析前都需要对这些数据进行预处理。读取并初步查看数据读取数据后查看数据特征列,首先筛选出分析所需要的列,然后再对数据进行描述统计(describe)和箱线图(boxplot),查看数据的缺失情况,异常值分布情况。但是在特征量很多时并不适合用图查看。在进行数据统计时,在spyder中为了显示所有行和列,会需要用到两行语句:pd.set_option(‘display.max_rows’,None) #显示所有行

2021-02-07 10:17:41 1780

原创 多个dataframe的列合并与行合并

根据时间索引合并列将多个数据表,以时间为索引,并选取需要分析的列进行合并。在本文中,拿到的数据是同一时期的不同设备的特征数据,需要提取对应的列进行时间合并,在合并过程中存在以下问题:1、时间索引存在重复,需要删除重复项,否则合并时会报错;2、每个表中需要提取的列名称一样,需要在合并前进行重新命名,否则合并后就无法区分;3、取共同时间进行合并,在同一时间段内不同表格的采集时间有差异,但是需要提取的是相同时间数据。数据初步查看选取文件所在的路径,读取文件并查看文件中的列名称import panda

2021-02-04 17:23:08 2370

原创 读取json文件并为DataFrame

JSON数据简介JSON数据已经成为通过Http请求在web浏览器和其他应用程序之间发送数据的标准格式之一,也是一种比较灵活的数据格式,在python数据分析中也能经常用到。下面实例简单分析提取json文件import jsonresult=json.load(open(r'E:\python总结\实例数据\读取json文件\database.json'))读取出来的数据中每一个条目都包含有7个字典列表,id,describption,tags等,每一个字典对应一种营养成分。In [7]:r

2021-02-04 09:55:14 720

原创 读取和写入文件

read_csv()读取CSV(逗号分割)文件到DataFrame部分常用参数:1、path:文件的位置;2、sep或delimiter:分隔符的格式,如:分号,空格,逗号等3、header:读取数据中列名称所在的行,默认header=0表示第一行是列名称,header=None表示不读取数据无列名,可以names联合用,设置列名;4、index_col:读取数据中索引的列名;5、names:当header=None时,用names来设置列名;6、skiprows:读取行数时需要跳过的行数;

2021-01-29 15:51:06 118

原创 文件夹与文件的读取,遍历和提取文件名等,glob.glob(),os.path.join()

glob.glob()函数的功能是查找指定文件路径下的文件名列表,可以采用模糊匹配的方式查找。参数:只有一个,文件路径pathname返回值:指定文件路径下的文件名列表,list类型。*:匹配0个或者多个字符;?:匹配单个字符;[]:匹配制定范围内的字符,如[0-9]匹配数字例子:import glob#读取文件夹下的所有文件pathname1=r'E:\python总结\实例数据\读取文件夹下的文件\*'for name in glob.glob(pathname1): p

2021-01-25 17:50:03 1754

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除