单变量、多变量分析绘图
1、单变量分析绘图 单变量其实就是我们通常接触到的数据集中的一列数据 单变量分析是数据分析中最简单的形式,其中被分析的数据只包含一个变量,因为它是一个单一的变量, 它不处理原因或者关系 单变量分析的主要目的是描述数据并找出其中存在的模式,也就是“用最简单的概括形式反映出大量数据 资料所容纳的基本信息”。 连续型数据: 连续型数据一般应用在计算机领域,在数据挖掘、数据分类时会遇到此类数据,因其数据不是单独的 整十整百的数字,包含若干位小数且取值密集,故称为连续型数据,例如,身高、体重、年龄等都是连续变量 离散型数据: 由记录不同类别个体的数目所得到的数据,称为离散型数据 从正态分布中随机获取N个数值 random是numpy模块的中的随机模块,random中的normal函数可以随机获取N个数值 numpy.random.normal(size=N) 在seaborn里最常用的观察单变量分布的函数是distplot(),默认地,这个函数会绘制一个直方图,并拟合一 个核密度估计 import seaborn as sns sns.distplot(data, bins, hist = True, kde = True) data参数记录绘图所用的数据,而bins参数在绘制直方图时可以进行设置,用于设置分组的个数,默认值时, 会根据数据的情况自动分为n个组,若是想指定分组