python 数据文件为“luohu.csv”,先进行数据预处理【简单易懂,代码直接运行】

该博客使用pandas和matplotlib库分析了'luohu.csv'数据文件,进行了数据预处理,删除了含有缺失值的行。接着,按'单位名称'分组统计了各单位人数,并对结果进行排序。重点展示了人数排名前10的单位,以条形图形式直观展示。柱状图清晰地描绘了这些单位的人数分布情况。
摘要由CSDN通过智能技术生成

数据文件为“luohu.csv”,先进行数据预处理

该题目的数据我放到资源里面的,但是我不知道那个收费不收费,我有时间了把他存到百度云盘/阿里云盘里面供大家下载

在这里插入图片描述

1、按照"单位名称"分组统计每个单位的人数信息,将人数排名前10的单位和人数用柱状图表示出来。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams["font.family"] = ['SimHei']
plt.rcParams["axes.unicode_minus"] = False
"""
先读取数据,然后对数据进行清洗
清洗数据后对数据进行分类处理
"""
#读取数据
data = pd.read_csv("luohu3.csv",sep=',')
#数据清洗
data.dropna(axis=0,how='any',inplace=True)
print(data.info())
#根据单位进行数据分类
work = data.groupby(data["单位名称"])["单位名称"].count()
#将得到的数据进行排序
work_num = work.sort_values(axis=0,ascending=False)
# print(work_num)
#提取画图数据
data_plt = work_num[0:10]
#画图
data_plt.plot(kind = "bar")
#显示图像
plt.show()

点个👍吧!!!!
运行效果如图:
在这里插入图片描述
点个👍吧!!!!
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

henu-于笨笨

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值