数据分析可视化复现

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings("ignore")
df = pd.read_csv("./data/HR.csv")
df = df[df["last_evaluation"]<=1][df["salary"]!="nme"][df["department"]!="sale"]

树状图

sns.countplot(x="salary",data=df)
<matplotlib.axes._subplots.AxesSubplot at 0x1a1873c048>

png

sns.countplot(x="salary",hue="department",data=df)
<matplotlib.axes._subplots.AxesSubplot at 0x1a182c0d30>

png

绘制直方图

f = plt.figure()
f.add_subplot(131)
sns.distplot(df["satisfaction_level"],bins=10)
<matplotlib.axes._subplots.AxesSubplot at 0x1a17815748>

png

f = plt.figure()
f.add_subplot(131)
sns.distplot(df["satisfaction_level"],bins=10,kde=False)
<matplotlib.axes._subplots.AxesSubplot at 0x113840f98>

png

f = plt.figure()
f.add_subplot(131)
sns.distplot(df["satisfaction_level"],bins=10,hist=False)
<matplotlib.axes._subplots.AxesSubplot at 0x1a17c3e9b0>

png

f = plt.figure()
f.add_subplot(131)
sns.distplot(df["satisfaction_level"],bins=10)
f.add_subplot(132)
sns.distplot(df["last_evaluation"],bins=10)
f.add_subplot(133)
sns.distplot(df["average_monthly_hours"],bins=10)
<matplotlib.axes._subplots.AxesSubplot at 0x1a17d31160>

png

箱线图

sns.boxplot(y=df["time_spend_company"])
<matplotlib.axes._subplots.AxesSubplot at 0x1a17f06128>

png

sns.boxplot(x=df["time_spend_company"],saturation=0.75,whis=3)
<matplotlib.axes._subplots.AxesSubplot at 0x1a18e94b70>

png

折线图

sub_df = df.groupby("time_spend_company").mean()
sns.pointplot(sub_df.index,sub_df["left"])
<matplotlib.axes._subplots.AxesSubplot at 0x1a19e08208>

png

sns.pointplot(x="time_spend_company",y="left",data=df)
<matplotlib.axes._subplots.AxesSubplot at 0x1a1919c6d8>

png

lbs = df["department"].value_counts().index
plt.pie(df["department"].value_counts(normalize=True),labels=lbs,autopct="%1.1f%%")
plt.show()

png

lbs = df["department"].value_counts().index 
explodes=[0.1 if i=="sales" else 0 for i in lbs]
plt.pie(df["department"].value_counts(normalize=True),explode=explodes,labels=lbs,autopct="%1.1f%%")
plt.show()

png

lbs = df["salary"].value_counts().index 
explodes=[0.1 if i=="low" else 0 for i in lbs]
plt.pie(df["salary"].value_counts(normalize=True),explode=explodes,labels=lbs,autopct="%1.1f%%")
plt.show()

png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值