数据分析
一腔诗意喂了猫
这个作者很懒,什么都没留下…
展开
-
TypeError: 'AxesSubplot' object is not subscriptable的解决办法
《Python数据分析与挖掘实战》第三章中代码清单3-1照书写会出现这个问题:TypeError: 'AxesSubplot' object is not subscriptable。原始代码如下:p=data.boxplot()x=p['fliers'][0].get_xdata()y=p['fliers'][0].get_ydata()y.sort()产生的原因可能是没有原创 2017-12-11 20:40:14 · 16619 阅读 · 3 评论 -
数据分布分析
分布分析用来解释数据的分布特征和分布类型,显示其分布情况。分布分析主要分为两种:对定量数据的分布分析和对定性数据的分布分析。对定量数据的分布分析按照以下步骤执行:1:求极差2:决定组距与组数。3:决定分点。4:得到频率分布表。5:绘制频率分布直方图遵循的原则有:1:所有分组必须将所有数据包含在内。2:各组的组宽最好相等。3:各组相斥。对定性数据的分布分析原创 2017-12-11 20:50:57 · 8001 阅读 · 0 评论 -
Matplotlib基础知识
Matplotlib是Python中专门用于数据可视化的一个库,其中将各种显示方法封装为不同的类供用户使用,并将其命令操作封装在了pyplot子库中,相当于一个快捷方式,通过调用pyplot,就可以使用Matplotlib的所有可视化方式,使用方法为import matplotlib.pyplot as plt,其中plt为一个约定俗成的别名。下面是一个简单的例子:# -*- coding原创 2017-12-13 18:42:29 · 290 阅读 · 0 评论 -
pyplot的plot函数
(本文是北理工嵩天老师MOOK课程的笔记之一)plt.plot(x,y,format_string,**kwargs)x:x轴数据y:y轴数据format_string:可选参数,控制曲线的格式字符串,由颜色字符,风格字符,标记字符组成,可以组合使用。**kwargs:更多组(x,y,format_string)参数,可以用来绘制多条曲线,但与编程相对应,每条的x参数都不能省略原创 2017-12-13 19:26:28 · 893 阅读 · 0 评论 -
pyplot的中文显示
(本文是北理工嵩天老师的MOOK课程的笔记之一)pyplot默认并不支持中文显示,需要手动进行一定的处理。方法一(这种方法通过修改全局的字体进行实现,不推荐):通过rcParams修改字体实现,其属性有:1:font.family:用于显示字体的名字 2:font.style:字体的风格(正常,斜体等)原创 2017-12-13 19:59:03 · 2881 阅读 · 0 评论 -
Pyplot文本显示方法
(本文为北理工嵩天老师MOOK的笔记)pyplot主要有以下的文本显示函数:plt.xlabel():对x轴增加文本标签。plt.ylabel():对y轴增加文本标签。plt.title():对图形整体增加文本标签,放置在整个图形的正上方。plt.text():在任意位置增加文本。plt.annotate():在图像中增加带箭头的注解。一个例子:# -*- co原创 2017-12-13 20:14:45 · 1054 阅读 · 0 评论 -
numpy.random.seed()方法的作用
numpy.random.seed()是个很有意思的方法,它可以使多次生成的随机数相同。如果在seed()中传入的数字相同,那么接下来使用random()或者rand()方法所生成的随机数序列都是相同的(仅限使用一次random()或者rand()方法,第二次以及更多次仍然是随机的数字),知道改变传入seed()的值,以后再改回来,random()生成的随机数序列仍然与之前所产生的序列相同。例原创 2017-12-13 21:42:59 · 27579 阅读 · 5 评论 -
绘制引力波
(本文是北理工嵩天老师MOOK课程笔记之一)# -*- coding:utf-8 -*-import numpy as npimport matplotlib.pyplot as pltfrom scipy.io import wavfilerate_h,hstrain=wavfile.read(r"H1_Strain.wav","rb")rate_l,lstrain=wavf原创 2017-12-14 21:20:02 · 449 阅读 · 0 评论 -
Pandas的数据类型操作
.reindex()方法可以用来改变或者重排Series和DataFrame的索引(一起改变的还有其内容的排列顺序)其主要参数有:index,columns:新的行列自定义索引fill_value:重新索引中,用于填充缺失位置的值method:填充方法,有两种,向前填充(ffill)和向后填充(bfill),这个是指定了columns才用处。limit:最大填充量copy:原创 2017-12-16 18:47:12 · 559 阅读 · 0 评论