data=np.random.rand(1000)
sns.kdeplot(data);
**sns.kdeplot()**
> 函数功能
>> 拟合并绘制单变量或双变量核密度估计值
> 重要参数
>> data:数据集,可以只输入一个,也可以输入两个
>> shade:在密度曲线下方加阴影(如果数据是双变量时,填充轮廓)
>> vertical:控制密度轴向
>> bw:类似于直方图中的binwidth,用于确定核大小
>> kernel:核函数(双变量KDE只能使用高斯核)
>>> 核函数种类说明:
>>> gau:gaussian高斯核(常用)
>>> cos:cosine余弦
>>> biw:biweight 四次
>>> epa:Epanechnikov 抛物线
>>> tri:triangle三角
>>> triw:triweight 三次
sns.kdeplot(data
,shade=True
,color='r'
,alpha=0.8
,linewidth=3
,linestyle='--'
);
plt.hist(data);
df = pd.read_csv("mpg_ggplot2.csv")
df.loc[df.cyl==4,'cty'].values
c4 = df.loc[df.cyl==4,'cty'].values`在这里插入代码片`
sns.kdeplot(c4
,shade=True
,color='r'
,alpha=0.3
,label='Cyl=4'
);
c4 = df.loc[df.cyl==4,'cty'].values
c5 = df.loc[df.cyl==5,'cty'].values
c6 = df.loc[df.cyl==6,'cty'].values
c8 = df.loc[df.cyl==8,'cty'].values
plt.figure(figsize=(12,8),dpi=60)
sns.kdeplot(c4,shade=True,color='deeppink',alpha=0.6,label='Cyl = 4')
sns.kdeplot(c5,shade=True,color='green',alpha=0.6,label='Cyl = 5')
sns.kdeplot(c6,shade=True,color='blue',alpha=0.6,label='Cyl = 6')
sns.kdeplot(c8,shade=True,color='orange',alpha=0.6,label='Cyl = 8')
plt.title('城市里程随气缸数变化密度图',fontsize=20)
plt.xlabel('城市里程(cty)',fontsize=18)
plt.xticks(fontsize=15)
plt.yticks(fontsize=15)
plt.legend(fontsize=13,loc=0);
df = pd.read_csv("mpg_ggplot2.csv")
plt.figure(figsize=(12,8), dpi= 60)
sns.kdeplot(df.loc[df['cyl'] == 4, "cty"], shade=True, color="g", label="Cyl=4", alpha=.7)
sns.kdeplot(df.loc[df['cyl'] == 5, "cty"], shade=True, color="deeppink", label="Cyl=5", alpha=.7)
sns.kdeplot(df.loc[df['cyl'] == 6, "cty"], shade=True, color="dodgerblue", label="Cyl=6", alpha=.7)
sns.kdeplot(df.loc[df['cyl'] == 8, "cty"], shade=True, color="orange", label="Cyl=8", alpha=.7)
plt.title('Density Plot of City Mileage by n_Cylinders', fontsize=22)
plt.legend()
plt.show()