Windows 10 - Python - 数据分析 - 年龄分组统计 - 条形图 - matplotlib

沐修

已于 2023-05-18 11:10:15 修改

阅读量3.5k

点赞数 2

分类专栏：数据分析文章标签： python 开发语言后端经验分享其他

于 2022-04-24 11:39:59 首次发布

本文链接：https://blog.csdn.net/qq_42701659/article/details/124378096

版权

数据分析专栏收录该内容

9 篇文章 1 订阅

订阅专栏

最近需要用到条形图，统计年龄，所以查了一下资料，修改为满足自己要求的条形图，下面看代码自行领会。

测试环境：

操作系统： Window 10
工具：Pycharm
Python: 3.7
matplotlib: 3.5.1
pandas: 1.3.5
numpy: 1.21.6

Virtualenv 虚拟环境下安装 matplotlib、pandas

pip installl matplotlib
pip installl pandas

test.xlsx 文件配置链接：
Windows 10 - Ptyhon - 数据分析 - Openpyxl 导入Excel

代码演示：

#!/usr/bin/env python
# -*-coding:utf-8-*-
import matplotlib.pyplot as plt  # 导入库
import os
import pandas as pd
import numpy as np
PATH = os.path.abspath('.')  # . 表示当前所处的文件夹的绝对路径, .. 两个点代表上一级的绝对路径
EXCELPATH = PATH + r"\test.xlsx"   # excel 文件路径

def paint():
    # plt.rcParams['font.sans-serif'] = 'simhei'  # 用来正常显示中文（黑体）常用字体包括：楷体: Kaiti
    #                                                  # 仿宋: FangSong 微软雅黑: Microsoft YaHei 黑体: SimHei
    df = pd.read_excel(EXCELPATH,usecols=[2])
    print(df)

    print(df.info())  # 获取 DataFrame 的摘要
    print(df.head())  # 根据位置返回对象的前n行信息(默认值为5) ，用于快速测试数据集
    print(df.describe())  # 生成描述性统计数据，总结数据集分布的集中趋势，分散和形状，不包括 NaN值。
    # 数据预处理
    data = df.dropna(axis=0)  # 删除所有包含空值的行，0 是行，1 是列
    print(data.info())
    print(data)
    x = data["年龄"]
    print(data.describe())  # 查看最大值与最小值
    bins = np.arange(10, 50, 5)   # 这里是 10 - 45 岁之间，间隔为 5 岁
    time_bins = pd.cut(x, bins)  # 对数据进行离散化处理
    print(time_bins)
    df1 = data.groupby(time_bins)["年龄"].count()
    print(df1)
    # 绘制图形
    df1.plot(kind="bar", rot=0)
    plt.rcParams['font.sans-serif'] = ['Kaiti']  # 用来正常显示中文（黑体）常用字体包括：楷体: Kaiti
                                                 # 仿宋: FangSong 微软雅黑: Microsoft YaHei 黑体: SimHei
    plt.rcParams['axes.unicode_minus'] = False   #运行配置参数总的轴（axes）正常显示正负号（minus）
    plt.show()

# 调用年龄统计方法
paint()

参考链接：

统计年龄分布情况（5岁的间隔统计），绘制出年龄分布图。

pandas plot参数

【matplotlib】plot()kind参数表

plt.rcParams[‘font.sans-serif‘] = [‘SimHei‘] 和plt.rcParams[‘axes.unicode_minus‘] = False

沐修

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Windows 10 - Python - 数据分析 - 年龄分组统计 - 条形图 - matplotlib

最近需要用到条形图，统计年龄，所以查了一下资料，修改为满足自己要求的条形图，下面看代码自行领会。测试环境：操作系统： Window 10工具：PycharmVirtualenv 虚拟环境下安装 matplotlib、pandaspip installl matplotlibpip installl pandastest.xlsx 文件配置链接：Windows 10 - Ptyhon - 数据分析 - Openpyxl 导入Excel代码演示：#!/usr/bin/env python
复制链接

扫一扫