可视化处理的前置处理
数据清洗
对于可视化的过程,拿到一份数据,我们首先要做的是进行数据清洗。我在这篇博文:数据清洗的目的,方法
介绍了数据清洗的一个通用步骤。
针对这个通用流程,我们 准备了一份医疗领域 的通用 样例数据,准备进行分析探查以及基本的可视化工作。
使用pandas 对数据进行处理
通过文件加载,我们首先需要将文件中的数据转化为pandas 的dataframe ,
假设我们有一个脱密后的HIS数据
# 删除不需要的列
medicalTest_Delete_list= ["序号"]
medicalTest_str_list = [
"诊断编码(ICD编码)"
,"诊断名称"
,"出院小结"
,"出院小结"
,"医院科室"]
medicalTest_IntegerType_list = ["序号","实际住院天数"]
medicalTest_category_list = ["诊断编码(ICD编码)","诊断名称","医院科室"]
medicalTest_FloatType_list = ["基金支付金额","总金额"]
medicalTest_DateType_list = ["入院日期",