基于python的数据分析题目,python数据分析案例算法

本文通过药店销售数据的案例,详细介绍了如何使用Python进行数据分析,包括提出问题、导入数据、数据清洗(处理缺失值、列名重命名、数据类型转换)、构建模型(计算业务指标如月消费次数、金额和客单价)以及数据可视化。还提及了Python在人工智能领域的最新发展和学习资源的分享。
摘要由CSDN通过智能技术生成

本篇文章给大家谈谈利用python进行数据分析案例,以及python用在数据分析的案例,希望对各位有所帮助,不要忘了收藏本站喔。

本节以某药店2018年商品销售数据为例来练习利用Python进行数据分析的基本方法。

数据分析基本步骤: 1、提出问题 2、理解数据 3、数据清洗 4、构建模型 5、数据可视化

一、提出问题

要分析解决业务数据问题,首先要与业务部门进行沟通学习python用什么书好。本节案例主要分析月消费次数、月消费金额、客单价、消费趋势四大业务指标。对不理解的业务指标可以先自己去搜索引擎查找,实在找不到再去与业务人员沟通理解。

二、导入数据

注意在读取数据时可以先将所有数据按字符串读入,之后再转换为其他格式。

#导入数据分析包

import pandas as pd

‘’‘路径中最好不要有中文,或者特殊符号啥的,不然路径会提示错误找不到。最好将文件放到一个简单的英文路径下’‘’

#excel文件路径,路径中的./表示在当前notebook所在的文件夹路径

fileNameStr=r’F:\数据分析\跟猴子学习人工智能核心技术\数据分析(高级)(Python)\第3关:数据分析的基本过程\朝阳医院2018年销售数据.xlsx’

‘’‘使用pandas的read_excel函数读取Ecxcel数据参数sheet_name:数据在Excel里的哪个sheet下面,这块就写该sheet在excel里的名称参数dtype=str 统一先按照字符串读入,之后再转换pandas的read_excel函数官网地址:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_excel.html#pandas.read_excel’‘’

salesDf = pd.read_excel(fileNameStr,sheet_name=‘Sheet1’,dtype=str)

#用pd.read_excel()方法也可以导入数据

salesDf=pd.read_excel(r’F:\数据分析\跟猴子学习人工智能核心技术\数据分析(高级)(Python)\第3关:数据分析的基本过程\朝阳医院2018年销售数据.xlsx’,dtype=‘object’)

print(salesDf.head())

购药时间 社保卡号 商品编码 商品名称 销售数量 应收金额 实收金额

0 2018-01-01 星期五 001616528 236701 强力VC银翘片 6 82.8 69

1 2018-01-02 星期六 001616528 236701 清热解毒口服液 1 28 24.64

2 2018-01-06 星期三 0012602828 236701 感康 2 16.8 15

3 2018-01-11 星期一 0010070343428 236701 三九感冒灵 1 28 28

4 2018-01-15 星期五 00101554328 236701 三九感冒灵 8 224 208

#有多少行,多少列

salesDf.shape

#查看每一列的数据类型

salesDf.dtypes

三、数据清洗

数据清洗的步骤花费时间最多,大概有80%的时间都用来进行数据清洗,不过清洗完成后数据运用起来就非常便捷了。

1)选择子集(本案例不需要选择子集)

#注释掉,.loc方法可以直接修改数据

#subSalesDf=salesDf.loc[0:4,‘购药时间’:‘销售数量’]

2)列名重命名

#字典:旧列名和新列名对应关系

colNameDict = {‘购药时间’:‘销售时间’}

‘’‘inplace=False,数据框本身不会变,而会创建一个改动后新的数据框,默认的inplace是Falseinplace=True,数据框本身会改动’‘’

salesDf.rename(columns = colNameDict,inplace=True)

salesDf.head()

销售时间 社保卡号 商品编码

  • 13
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值