Python处理诊断编码数据

辉哥的博客

于 2021-09-30 16:06:45 发布

阅读量408

点赞数

分类专栏： Python 文章标签： Python 数据处理诊断编码统计分析 DataFrame

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43278973/article/details/120568375

版权

Python 专栏收录该内容

10 篇文章 2 订阅

订阅专栏

Python处理诊断编码数据

需求：一个诊断名称对应多个诊断编码，取出现次数最多的那一个。

import pandas as pd

df = pd.DataFrame([['糖尿病','1'],['糖尿病','2'],['糖尿病','3'],['糖尿病','1'],['糖尿病',''],['糖尿病',''],
                 ['高血压','1'],['高血压','2'],['高血压','3'],['高血压','1'],['高血压',''],['高血压','']
                 ],columns=['diag_name','code'])

sheet_rows = df.shape[0]
result_file = './result/diag_stand.csv'

#定义DataFrame列名
df_col_names = ['diag_name','code']
#定义1个DataFrame
df_result = pd.DataFrame(columns=df_col_names)

#1.排掉"code"列为空的数据
for row in range(sheet_rows):
    if df.iloc[row, 1] == '':
        continue
    else:
        diag_name = df.iloc[row, 0] #行 列
        code = df.iloc[row, 1]
        df_temp = pd.DataFrame([[diag_name,code]],columns=df_col_names)
        df_result = df_result.append(df_temp, ignore_index=True)

#2.按照diag_name,code分组，统计出现的次数,添加count列,按照diag_name,count分组,降序
gp = df_result.groupby(by=['diag_name','code']).size().reset_index(name='count').sort_values(by=['diag_name','count'],ascending=(False,False))
# print(gp)

#head(1) 每一组取第1条
gp2 = gp.groupby('diag_name').head(1).sort_values(by=['count'],ascending=(False))
gp2.to_csv(result_file,index=False)

处理前数据
在这里插入图片描述
处理后数据

reference
1.Python技巧之对DataFrame进行多列排序
https://blog.csdn.net/m0_37637511/article/details/79901071

辉哥的博客

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

辉哥的博客 CSDN认证博客专家 CSDN认证企业博客

码龄6年

47: 原创

10万+: 周排名

62万+: 总排名

17万+: 访问

: 等级

591: 积分

20: 粉丝

45: 获赞

10: 评论

226: 收藏

私信

关注

热门文章

分类专栏

Python 10篇
Oracle 14篇
Notepad++ 1篇
Grep 1篇
笔记 7篇
git 2篇
Linux 1篇
Typora 3篇
Navicat
Kettle 5篇
DB2 3篇
OCR 1篇
word 1篇
regexp 1篇
sed 1篇
Markdown 1篇
MySQL 1篇
RStudio 1篇

最新评论

MySQL5.7版本没有row_number函数的写法
rustfree: SELECT @RN = 0, @DIAGNOSIS_NAME = 0少了冒号
MySQL5.7版本没有row_number函数的写法
rustfree: 变量初始化有误，应该是SELECT @RN:= 0, @DIAGNOSIS_NAME:= 0
Oracle的md5函数
辉哥的博客: 1.使用具有足够权限的用户登录数据库，例如sys或system。 2.授予您的用户（C##TESTUSER）CREATE ANY PROCEDURE权限。例如，使用sys登录，并执行以下命令： GRANT CREATE ANY PROCEDURE TO C##TESTUSER; 3.重新运行您的代码创建MD5函数。 4.如果步骤2不起作用，请尝试授予您的用户更高级别的权限，例如DBA角色： GRANT DBA TO C##TESTUSER; 注意：授予权限是一种安全风险。建议您在授予权限之前评估您的安全需求和限制。
Oracle的md5函数
哎呦喂是豆子～: > ORA-24344: 成功, 但出现编译错误 PLS-00905: 对象 C##TESTUSER.MD5 无效一直报这个是为啥呀数据库版本oracle21c 求指导
Oracle删除前置零
Mr_Yang98: 删除前置0直接：LTRIM(ColumnName, '0')就好啦

大家在看

Python解释器

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。