分类情况
import matplotlib.pyplot as plt
plt.figure(figsize = (10, 5))
plt.subplot(1, 2, 1)
# sns.countplot:柱状图
sns.countplot(x = 'Survived', data = train)
plt.title('Survival count')
plt.subplot(1, 2, 2)
# plt.pie: 饼状图
plt.pie([nonsurvived_sum, survived_sum], labels = ['not survived', 'survived'], autopct='%1.0f%%')
plt.title('Survived rate')
plt.show()
效果如图:
train.groupby('Pclass')['Survived'].mean().plot(kind = 'bar') # 画分组条形(柱状)图
plt.ylabel('Survival rate')
plt.show()
# 结构化多绘图网格
facet = sns.FacetGrid(train_delete, hue = 'Survived', aspect = 2)
facet.map(sns.kdeplot, 'Age', shade = True) # kdeplot 密度图
facet.set(xlim = (0, train['Age'].max())) # x限制
# 添加图例
facet.add_legend()
plt.xlabel('Age')
plt.ylabel('Density')
# sns直接画柱状图
sns.barplot(x = 'Family_size', y = 'Survived', data = train)
# 直接画折线图
plt.plot(k_range,cv_scores)
plt.xlabel('K')
plt.ylabel('Accuracy') #通过图像选择最好的参数
plt.show()
回归情况
sns.pairplot(data) 分布图
plt.pyplot.figure(figsize = (10, 10))
sns.heatmap(data.corr(), annot = True, cmap = “YlGnBu”)
热点图,展示两两特征之间的相关度