python分析患者数据:pandas 和matplotlib

本文介绍了使用Python的pandas和matplotlib库进行数据清洗与可视化的实践,包括读取CSV/Excel文件、数据清理(删除列、数值替换、列名修改)、数据计算、分组统计以及数据可视化(折线图、柱状图、散点图和箱线图)。通过实例展示了如何在数据分析中应用这些工具。
摘要由CSDN通过智能技术生成

使用python进行数据清洗及可视化

今天第一次使用pandas和matplotlib处理数据,以下纪录一些使用心得:

1、首先第一步就是要导入一些使用包:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

要把csv或者excel文件读取出来:

pa = pd.read_csv('E:/练习数据/patient.csv')

这里需要注意,我们直接复制出来的文件路径格式一般都是 \ ,这里我们要转换成 / ;
2 、由于我的文件列数过多,所以在notebook中显示不完全,如果要显示所有列,那就需要在开头进行一些设置:

pd.set_option('display.max_columns',None)

主要用到的就是set_option方法,具体用法可以参考其他文章;

3、之后就进入到了数据清理阶段:
首先删除不需要的列:

pa.drop(['病人卡号','病人姓名','省份','城市','咨询医生','类型','type_message'], axis=1, inplace=True)

这里使用drop方法,参数方面axis默认为0,是删除行,置为1是删

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值