cory511-CSDN博客

原创 TXT报告批量转化归纳为excel

#必要包import numpy as npimport pandas as pdimport os#txt目录文档路径path = 'C:/Users/Administrator/Desktop/2'#遍历txt目录文档，找到目录文档里每个txt的名字os.listdir(path)#批量获得每个txt的路径filelist = [path + '/' +i for i in os.listdir(path)]#导入单个txt文件教程with open("C:/Users/.

2021-11-09 11:09:41 263

原创周报脚本1.0

import numpy as npimport pandas as pd#导入大盘数据ori = pd.read_excel('weekly_meeting/all_organization.xlsx',sheet_name='sheet2')#导入台账并改列名paramter = pd.read_excel('weekly_meeting/parameter.xlsx',sheet_name='机构明细')paramter = paramter[['机构名称','归属项目']].renam.

2021-08-20 16:30:26 146

原创 ROC曲线与KS曲线

1.定义二分类问题中，若两个类别一个为阴性一个为阳性，则真实值与预测值可以对应出一个矩阵，成为混淆矩阵（Confusion Matrix）准确度：（真阴数+真阳数）/总数错误率：1-精确度精度：表示真阳性在所有预测为阳性例子中的比例真阳数/ （真阳数+假阳数）召回：表示真阳性在所有阳性例子中的比例真阳数 / （真阳数+假阴数）灵敏度：表示阳性样本被正确分类的比例真阳数 / （真阳数+假...

2021-07-23 11:32:05 392

原创阈值脚本2-自动更新

import numpy as npimport pandas as pdprint(df.isnull().any())#查询是否有na值#df2 = df1.fillna('无') 若有则做填充df = pd.read_excel('C:/Users/Administrator/Desktop/模型数据（CTD-topk）改5.xlsx',sheet_name = '99913')k = pd.DataFrame(columns=['模型阈值','AI数','真阳数','假阳数','真阴数'.

2021-07-21 15:38:27 107

原创【自用防丢失】测试用ROC曲线-plot简易版

# 读入数据import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn import svm, datasetsfrom sklearn.metrics import roc_curve, aucfrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import label_binari.

2021-07-15 18:27:20 79

原创【自用，防丢失】阈值脚本

import numpy as npimport pandas as pddf1=pd.read_excel('C:/Users/Administrator/Desktop/南京系统医生审核数据汇总（75314+4599）年龄.xlsx',sheet_name="75314")df2 = df1.fillna('无')#空值会影响字符串计数k = pd.DataFrame(columns=['年龄阈值','样本数','阳性数','真阳数','真阴数','假阴数','假阳数','假阴率','假阳率'.

2021-07-13 10:05:04 132

原创多表拆分整理

import pandas as pdimport numpy as np#读取整表数据data = pd.read_excel('C:/Users/cory511/Desktop/放射科病例一览表0101-0430.xls',encoding='gbk')#创建一个空表df = data[0:1].isnull()df = df.drop([0])data.shape#将整表按行切割成分表且导出csv文件for i in range(1,30430): j = [] P.

2021-05-30 23:56:24 74

原创根据空行拆分excel表并输出

import pandas as pddata = pd.read_excel('C:/Users/cory511/Desktop/.xls',encoding='gbk')df = data[0:1].isnull()df = df.drop([0])for i in range(1,100): j = [] P = data[i:i+1].isnull() P['Col_sum'] = P.apply(lambda x: x.sum(), axis=1) if .

2021-05-21 21:36:11 416

cory511的博客