python dataframe取某行某列_Python数据分析基础

本文通过药店销售案例介绍了Python数据分析的基础操作,包括数据导入、理解数据、数据清洗和构建模型。讲解了使用pandas处理数据,如数据读取、列重命名、缺失值处理、数据类型转换、数据排序、异常值处理等步骤,为后续的业务指标计算和模型建立奠定基础。
摘要由CSDN通过智能技术生成

利用Python进行数据分析过程首先要学会写代码,通过代码将数据分析的思路一步步实现。

通过药店销售案例练习Python数据分析时常用代码:

一、提出问题

从销售数据中分析出以下业务指标:

1、月均消费次数

2、月均消费金额

3、客单价

4、消费趋势

二、理解数据

1、数据导入

由于药店销售数据的格式是excel,因此需要先安装一个读取excel文件的依赖包:xlrd,安装步骤如下:

  • 先conda中进入当前notebook文件所在的python环境,命令为:activate py3
  • 再在pyhon环境下安装xlrd包,命令为:conda install xlrd

数据导入过程及代码如下:

(1)导入数据包

643e742f4ff1f5871a86c4cfd0427829.png

(2)读取excel数据

  • 先读取Excel数据,统一先按照字符串读入,之后转换;
  • 再定义一个Excel文件,用xls.parse解析Sheet1的内容。

778b2672efcdaf545c6170a1d76bab11.png

(3)检查数据正常与否

  • 函数:head(),默认前5行;
  • 打印出前5行,以确保数据运行正常。

f554e289cf10b598354b90141f9c4853.png

2、理解数据

(1)数据大小

  • 函数:shape(),数据大小(行数,列数)。

2c8099c9a5ec31199d7beb3bbc665562.png

(2)列字段名称及数据类型

  • 函数:dtypes,查看每一列的数据类型。

bdcdd0bb0320aa9ff07e263376f63d0d.png

三、数据清洗

数据分析过程中数据清洗过程如下:

73a60b8b650429b07d5e8e7273110fb8.png

(1)选择子集(切片)

该案例不需要选择子集。

610b5c823011beb0abad534b0217e467.png

(2)列重命名

  • 函数:colNameDict={A:B}(字典),将A用B进行替换;
  • 函数:inplace,默认是False,inplace=False说明数据框本身不会变,而会创建一个改动后新的数据框;inplace=True,说明数据框本身会改动。
  • 函数rename:重命名函数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值