数据文件为“luohu.csv”,先进行数据预处理
该题目的数据我放到资源里面的,但是我不知道那个收费不收费,我有时间了把他存到百度云盘/阿里云盘里面供大家下载
1、按照"单位名称"分组统计每个单位的人数信息,将人数排名前10的单位和人数用柱状图表示出来。
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams["font.family"] = ['SimHei']
plt.rcParams["axes.unicode_minus"] = False
"""
先读取数据,然后对数据进行清洗
清洗数据后对数据进行分类处理
"""
#读取数据
data = pd.read_csv("luohu3.csv",sep=',')
#数据清洗
data.dropna(axis=0,how='any',inplace=True)
print(data.info())
#根据单位进行数据分类
work = data.groupby(data["单位名称"])["单位名称"].count()
#将得到的数据进行排序
work_num = work.sort_values(axis=0,ascending=False)
# print(work_num)
#提取画图数据
data_plt = work_num[0:10]
#画图
data_plt.plot(kind = "bar")
#显示图像
plt.show()
点个👍吧!!!!
运行效果如图:
点个👍吧!!!!