清明节用python统计死亡人数,绘制各种图,会有程序员吗?

清明时节,一篇博客利用超过100万条全球死亡数据,使用Python的pandas和可视化库分析死亡率、职业、性别与年龄趋势。数据预处理排除异常值,可视化结果包括各年龄段死亡百分比、死亡职业排名、死亡原因和年代分布等。
摘要由CSDN通过智能技术生成

清明时节雨纷纷,路上行人欲断魂

清明节,又称踏青节、行清节、三月节、祭祖节等,节期在仲春与暮春之交。清明节源自早期人类的祖先信仰与春祭礼俗,是中华民族最隆重盛大的祭祖大节。清明节兼具自然与人文两大内涵,既是自然节气点,也是传统节日,扫墓祭祖与踏青郊游是清明节的两大礼俗主题,这两大传统礼俗主题在中国自古传承,至今不辍。

在这里插入图片描述


一、数据概览

该数据集包含了超过100多万名已故人的生活、
工作和死亡的结构化信息。

数据集: AgeDatasetV1.csv
一共1223009条数据。

通过全球122万名人的死亡数据,
我们可以了解大部分人的寿命,
在过去哪些年份的死亡人数较多,
哪些年份出生的人死亡人数较多,
以及不同性别的死亡年龄趋势,
不同职业的男性和女性的死亡人数。

在本案例中我们用到pandas,pyplot,seaborn绘饼状图、
长条图、堆积条形图、折线图,
获取数据集以及源码可以加vx: python10010

列名 描述
‘Id’, 编号
‘Name’, 名字
‘Short description’, 简述
Gender’, 性别
Country’, 国家
Occupation’, 职业
‘Birth year’, 出生年份
‘Death year’, 逝世年份
‘Manner of death’, 死亡方式
‘Age of death’ 去世年龄

在这里插入图片描述


二、数据预处理

发现有出生年份为负数的,
其实是正常值,
负值表示公元前。

import pandas as pd

df = pd.read_csv('.\data\AgeDatasetV1.csv')
df.info()

df.describe().to_excel(r'.\result\describe.xlsx')
df.isnull().sum().to_excel(r'.\result\nullsum.xlsx')
df[df.duplicated()].to_excel(r'.\result\duplicated.xlsx')

df.rename(columns=lambda x: x.replace(' ', '_').replace('-', '_'), inplace=True)
print(df.columns)
print(df[df['Birth_year'] < 0].to_excel(r'.\result\biryear0.xlsx'))

在这里插入图片描述

三、数据可视化

0、导入包和数据
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

plt.rcParams['font.sans-serif'] = ['SimHei'] 
plt.rcParams['axes.unicode_minus'] = False

df1 = pd.read_csv('./data/AgeDatasetV1.csv')
df1.rename(columns=lambda x: x.replace(' ', '_').replace('-', '_'), inplace=True)
print(df1.columns)
1、按不同年龄范围的死亡率百分比
plt.figure(figsize=(12, 
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值