读取数据集Distribution_Data.csv,根据class列的值将数据分为四组,并分别绘制每组数据的直方图及核密度曲线图。
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
import matplotlib as mpl
df=pd.read_csv('D:/浏览器下载/Distribution_Data.csv')#引入数据
sns.set_style("darkgrid")#设置seaborn的风格,一共有5种:darkgrid,whitegrid,dark, white,ticks
bins=30#控制直方图的划分,设置矩形图的数量
plt.figure(figsize=(6,1))#设置画布大小
x1=df[df['class']=="n"].value#选择数据
ax=n,bins,pincht=plt.hist(x1,bins,rwidth=0.8,density=True,facecolor='#ffc0cb')#画直方图
ax=sns.kdeplot(x1,shade=True,color="#ffc0cb",legend=False)#画核密度估计图
plt.xlim(0,8)#x坐标的取值范围
plt.yticks([0,0.5])#y坐标的显示刻度
plt.xlabel