Windows 10 - Python - 数据分析 - 年龄分组统计 - 条形图 - matplotlib

最近需要用到条形图,统计年龄,所以查了一下资料,修改为满足自己要求的条形图,下面看代码自行领会。

测试环境:

操作系统: Window 10
工具:Pycharm
Python: 3.7
matplotlib: 3.5.1
pandas: 1.3.5
numpy: 1.21.6

Virtualenv 虚拟环境下安装 matplotlib、pandas

pip installl matplotlib
pip installl pandas

test.xlsx 文件配置链接:
Windows 10 - Ptyhon - 数据分析 - Openpyxl 导入Excel

代码演示:

#!/usr/bin/env python
# -*-coding:utf-8-*-
import matplotlib.pyplot as plt  # 导入库
import os
import pandas as pd
import numpy as np
PATH = os.path.abspath('.')  # . 表示当前所处的文件夹的绝对路径, .. 两个点代表上一级的绝对路径
EXCELPATH = PATH + r"\test.xlsx"   # excel 文件路径

def paint():
    # plt.rcParams['font.sans-serif'] = 'simhei'  # 用来正常显示中文(黑体)常用字体包括:楷体: Kaiti
    #                                                  # 仿宋: FangSong 微软雅黑: Microsoft YaHei 黑体: SimHei
    df = pd.read_excel(EXCELPATH,usecols=[2])
    print(df)

    print(df.info())  # 获取 DataFrame 的摘要
    print(df.head())  # 根据位置返回对象的前n行信息(默认值为5) ,用于快速测试数据集
    print(df.describe())  # 生成描述性统计数据,总结数据集分布的集中趋势,分散和形状,不包括 NaN值。
    # 数据预处理
    data = df.dropna(axis=0)  # 删除所有包含空值的行,0 是行,1 是列
    print(data.info())
    print(data)
    x = data["年龄"]
    print(data.describe())  # 查看最大值与最小值
    bins = np.arange(10, 50, 5)   # 这里是 10 - 45 岁之间,间隔为 5 岁
    time_bins = pd.cut(x, bins)  # 对数据进行离散化处理
    print(time_bins)
    df1 = data.groupby(time_bins)["年龄"].count()
    print(df1)
    # 绘制图形
    df1.plot(kind="bar", rot=0)
    plt.rcParams['font.sans-serif'] = ['Kaiti']  # 用来正常显示中文(黑体)常用字体包括:楷体: Kaiti
                                                 # 仿宋: FangSong 微软雅黑: Microsoft YaHei 黑体: SimHei
    plt.rcParams['axes.unicode_minus'] = False   #运行配置参数总的轴(axes)正常显示正负号(minus)
    plt.show()

# 调用年龄统计方法
paint()

参考链接:

统计年龄分布情况(5岁的间隔统计),绘制出年龄分布图。

pandas plot参数

【matplotlib】plot()kind参数表

plt.rcParams[‘font.sans-serif‘] = [‘SimHei‘] 和plt.rcParams[‘axes.unicode_minus‘] = False

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
很好,我们可以使用Python来进行销售数据分析。首先,我们需要导入一些必要的库,如pandas、matplotlib和seaborn,它们可以用来读取数据、绘制表和可视化数据。假设我们有一个名为“sales.csv”的销售数据文件,其中包含了销售日期、销售额、产品类型等信息。 下面是一些代码示例,可以帮助你开始你的分析过程: ```python import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # 读取数据文件 sales_data = pd.read_csv('sales.csv') # 了解数据的基本信息 print(sales_data.head()) # 查看前5行数据 print(sales_data.describe()) # 描述性统计信息 print(sales_data.info()) # 数据类型和缺失值数量 # 统计每个产品类型的销售额 sales_by_product = sales_data.groupby('Product')['Sales'].sum() print(sales_by_product) # 绘制产品销售额条形图 plt.figure(figsize=(10,6)) sns.barplot(x=sales_by_product.index, y=sales_by_product.values) plt.title('Sales by Product') plt.xlabel('Product') plt.ylabel('Sales') plt.show() # 统计每个月的总销售额 sales_by_month = sales_data.groupby('Month')['Sales'].sum() print(sales_by_month) # 绘制月销售额折线 plt.figure(figsize=(10,6)) sns.lineplot(x=sales_by_month.index, y=sales_by_month.values, marker='o') plt.title('Sales by Month') plt.xlabel('Month') plt.ylabel('Sales') plt.show() ``` 这些示例代码可以帮助你了解数据的基本信息,以及如何对数据进行分组统计和绘。当然,这只是一个简单的例子,你可以根据实际情况进行更复杂的分析和可视化操作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值