之前已经分享过数据集的下载包啦,需要的小伙伴可以自行取用哦,下面介绍如何在上文统计出的空值数里分析客户年龄和月收入的情况
首先我们过一遍思路,我们准备用统计中直方图来表示年龄的情况,直方图可以通过matplot的pyplot库实现,所以我们首先导入库
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
接着我们导入要分析的文件,继续像上次使用俗称的第一列作为索引,也就是第0列
datafile='C:\\Users\\Administrator\\Desktop\\Test\\shujufenxi\\yuchuli\\cs-training.csv'
data=pd.read_csv(datafile,index_col=[0])
分析其中关于年龄的数据
age=data['age']
绘图
sns.displot(age)
plt.xlabel('age')
plt.ylabel
plt.show()
呈现的结果是这样的
在进行月收入的分析中,其他代码都是一样的,我们把age数据改成需要的monthly income就可以了,同时,由于客户们月收入相差比较大,可以选择对比的月收入范围,这里选择分析小于50000的月收入数据
mothlyincome=data[data['MonthlyIncome']<50000]['MonthlyIncome']
其他的代码和上面一样,只要改一下名称就行了,下面看结果
可以看出大部分人收入都在10000以内