python预测药_简单的Python数据分析实战:药品销售

该博客通过分析朝阳医院的药品销售数据,展示了如何使用Python进行数据清洗、数据类型转换、异常值处理和计算关键指标,如月均消费次数、月均消费金额和客单价。
摘要由CSDN通过智能技术生成

一、分析背景与目的

数据来源于朝阳医院的药品销售数据,需要从中获得4个方面的信息:月均消费次数

月均消费金额

客单价

消费趋势

二、数据理解

首先需要熟悉数据字段,先导入python中查看基本情况。

# 载入模块

import pandas as pd

import numpy as np

# 读取:统一先按照str读入,之后转换

fileName='D:\learning\data science\数据分析(高级)(Python)\第3关:数据分析的基本过程\朝阳医院2018年销售数据.xlsx'

xls=pd.ExcelFile(fileName, dtype='object')

salesDf=xls.parse('Sheet1',dtype='object')

读取完成后打印前5行数据:

salesDf.head()

查看数据量和列的数据类型:

# 数据量

salesDf.shape

# 列的数据类型,记得dtype后加s

salesDf.dtypes

三、数据清洗

数据清洗可以分为6个步骤:

1、选择子集

选择分析需要用到的子集。通过切片完成,本案例不需要选择子集。

2、列名重命名

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值