利用Python进行数据分析(附详细案例)

334 篇文章 4 订阅
137 篇文章 5 订阅

一、前期准备

分析要用到两个包:NumPy和Pandas,首先确保jupyter中成功安装了这两个包。

#导入numpy包
import numpy as np
#导入pandas包
import pandas as pd

二、基础知识

2.1 一维数据分析:NumPy
在这里插入图片描述
2.2 一维数据结构:Pandas
在这里插入图片描述
2.3 二维数据分析:numpy对应array
在这里插入图片描述
2.4 二维数据分析:pandas对应数据框DateFrame
在这里插入图片描述
此处遇到一个问题:读取Excel文件报错。

解决方法:

1 查看Excel文件存放路径

具体操作:点击文件名,鼠标右键,选择“属性”,找到下面标红的两个地方。
在这里插入图片描述
2 将上面标红的两处合成文件的路径,

格式为文件夹\文件名,比如F:\ann\Untitled1.ipynb

3 最后把路径中全部的斜杠(/)或者反斜杠(\)替换为双反斜杠(\)

最后的路径为F:\ann\Untitled1.ipynb

三、Python具体案例分析:药店销售数据

在这里插入图片描述

3.1 提出问题

分析指标:

月均消费次数
月均消费金额
客单件
消费趋势

3.2 理解数据
在这里插入图片描述
3.3 清洗数据
在这里插入图片描述
3.3.1 选择子集
在这里插入图片描述
3.3.2 列名重命名
在这里插入图片描述
3.3.3 缺失数据处理(dropna()函数)

Python缺失值有3种:None,NA,NaN。(分析数据时,如果遇到什么错误,比如float错误,就要考虑是否为缺失值,若是,则需要处理掉)。

  1. Python内置的None值;
  2. pandas中,将缺失值表示 为NA,表示不可用not available;
  3. 对应数值数据,pandas使用浮点值NaN(Not a Number)表示缺失数据;

None和NaN的区别:None是Python的一种数据类型(NoneType),NaN是浮点类型(float),两个都用作空值。
在这里插入图片描述
3.3.4 数据类型转换
在这里插入图片描述
3.3.5 数据排序
在这里插入图片描述
3.3.6 异常值处理
在这里插入图片描述
3.4 构建模型

3.4.1 指标1:月均消费次数=总消费次数/月份数
在这里插入图片描述
3.4.2 指标2:月均消费金额=总消费金额/月份数
在这里插入图片描述
3.4.3 指标3:客单价=总消费金额/总消费次数

客单价(per customer transaction):商场(超市)每位顾客平均购买商品的金额,即是平均交易金额。
在这里插入图片描述

3.4.3 消费趋势
在这里插入图片描述
读者福利:知道你对Python感兴趣,便准备了这套python学习资料

👉[[CSDN大礼包:《python兼职资源&全套学习资料》免费分享]]安全链接,放心点击

对于0基础小白入门:

如果你是零基础小白,想快速入门Python是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案

包括:Python激活码+安装包、Python web开发,Python爬虫,Python数据分析,人工智能、机器学习等习教程。带你从零基础系统性的学好Python!

零基础Python学习资源介绍

  • ① Python所有方向的学习路线图,清楚各个方向要学什么东西
  • ② 600多节Python课程视频,涵盖必备基础、爬虫和数据分析
  • ③ 100多个Python实战案例,含50个超大型项目详解,学习不再是只会理论
  • ④ 20款主流手游迫解 爬虫手游逆行迫解教程包
  • 爬虫与反爬虫攻防教程包,含15个大型网站迫解
  • 爬虫APP逆向实战教程包,含45项绝密技术详解
  • ⑦ 超300本Python电子好书,从入门到高阶应有尽有
  • ⑧ 华为出品独家Python漫画教程,手机也能学习
  • ⑨ 历年互联网企业Python面试真题,复习时非常方便

👉Python学习路线汇总👈

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。(全套教程文末领取哈)
在这里插入图片描述

👉Python必备开发工具👈

在这里插入图片描述

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末

👉Python学习视频600合集👈

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述

👉实战案例👈

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

👉100道Python练习题👈

检查学习结果。
在这里插入图片描述

👉面试刷题👈

在这里插入图片描述

在这里插入图片描述

👉python副业兼职与全职路线👈

在这里插入图片描述

上述这份完整版的Python全套学习资料已经上传CSDN官方,朋友们如果需要可以微信扫描下方CSDN官方认证二维码 即可领取↓↓↓

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
以下是一个简单的数据分析案例,使用PythonPandas库: 假设我们有一个包含销售数据的csv文件,文件名为'sales_data.csv',其中包含列:日期、产品、销售数量、销售额。 我们想要进行一些数据分析,例如: 1. 每个产品的总销售量和总销售额。 2. 每个月的总销售量和总销售额。 3. 最受欢迎的产品是哪个? 以下是使用PythonPandas进行数据分析的代码: ```python import pandas as pd # 读取csv文件 df = pd.read_csv('sales_data.csv') # 每个产品的总销售量和总销售额 total_sales = df.groupby('产品').agg({'销售数量': 'sum', '销售额': 'sum'}) print(total_sales) # 每个月的总销售量和总销售额 df['日期'] = pd.to_datetime(df['日期']) # 将日期转换为datetime类型 df['月份'] = df['日期'].dt.to_period('M') # 新增一列月份 monthly_sales = df.groupby('月份').agg({'销售数量': 'sum', '销售额': 'sum'}) print(monthly_sales) # 最受欢迎的产品是哪个? popular_product = df.groupby('产品').agg({'销售数量': 'sum'}).idxmax().values[0] print(f'The most popular product is {popular_product}.') ``` 这个案例演示了如何使用PythonPandas来对数据进行分析。Pandas是一个强大的数据分析库,提供了许多用于数据操作和分析的函数和方法。在这个案例中,我们使用groupby函数对数据进行分组和聚合,以查找每个产品的总销售量和总销售额,每个月的总销售量和总销售额,以及最受欢迎的产品。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值