自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 Excel文件操作-Excel文件key值比对,输出修改内容

excel文件key值文件比对,输出新增、修改、修改内容

2022-08-23 14:17:47 362 1

原创 Excel文件操作-批量筛选

用于excel文件所有sheet一键筛选,删除未选中内容

2022-08-23 14:12:03 375

原创 if __name__==‘__main__‘笔记

print(__name__) #输出:__main__作用:当某一.py文件中包含定义的函数时,调用函数时将函数调用过程放在if name==‘main’:结构中,此时,如果直接运行此程序,可正常运行,没有任何影响,区别是当此文件作为模块被其他.py文件(其他__name__)调用时,因为此时__name__不再等于‘main’,所以if name == “main”:下方的代码块不会直接运行。def print1(): print('aa') if __name__

2022-04-27 10:22:41 100

原创 PDF转Word

PDF文件转换为Word文件:from pdf2docx import Converterimport osimport tkinter as tkimport tkinter.messageboxfrom tkinter import filedialog,dialogimport threading #线程#设置GUIPpath='NA'opath='NA'def pdf(): global Ppath Ppath=filedialog.askdirectory(

2022-04-20 10:33:55 740

原创 Python用于临床数据管理-根据访视时间窗计算缺失页面

#获取项目报告管理-数据检查报告-数据清洗进度报表,然后将受试者状态添加到表格中,连同数据集一起作为原始数据。#导入所需的库import pandas as pdfrom datetime import datetimenow=datetime.now()import re#读入page列表和数据集给药表单writer=pd.ExcelWriter(r'C:\Users\XinXinbuX280\Desktop\E4F4P\output\E4F4缺失页面统计.xlsx')pagefile=r

2022-02-08 15:16:46 524

原创 Python用于临床数据管理-Lab-AE核查-new-3-多次输出结果比较

#原文件新增一列【核查备注】列,新文件无需处理import osimport pandas as pdimport excelformat2filename_old=os.listdir(r'C:\Users\XinXinbuX280\Desktop\阿达木三期p\rawdata\文件比对\原')filename_new=os.listdir(r'C:\Users\XinXinbuX280\Desktop\阿达木三期p\rawdata\文件比对\新')path_old=r'C:\Users\

2022-02-08 15:09:27 397

原创 Python用于临床数据管理-Lab-AE核查-new-2-MH&AE匹配到LB

#AE结束日期为空,则设置为2100-01-01,日期含有UNK,则已01替换,开始日期年月日军均未知替换为1900-01-01import pandas as pdimport mymodimport excelformat2import re from datetime import datetimefrom fuzzywuzzy import fuzz#文件读入,输出路径定义---------------------------------------------------------

2022-02-08 15:08:17 831

原创 Python用于临床数据管理-Lab-AE核查-new-1-生成LB异常有临床意义listing

import pandas as pdimport mymodimport excelformat2date=mymod.datestr()writer=pd.ExcelWriter(r'C:\Users\XinXinbuX280\Desktop\阿达木三期p\output\阿达木三期异常有临床意义LB{}.xlsx'.format(date))file=r'C:\Users\XinXinbuX280\Desktop\阿达木三期p\rawdata\WIBP2018004_阿达木III期_数据库

2022-02-08 15:06:37 561

原创 Python用于临床数据管理-CRF排版

'''注意事项:1、流程图必须不包含合并单元格,一列对应一个访视,一行对应一个表单;2、所需表单的单元格不为空即可,不需要的表单对应的单元格为空;3、流程图中表单的顺序需要与unique CRF文件中表格的顺序一致,名称可以不一致;4、程序会根据流程图第一行设置页眉中的访视信息,根据流程图第二行设置页眉中的时间窗信息,其余信息请添加在CRF文件最后一个表格中,作为页眉模板;5、流程图A1单元格内容必须为“访视编号”;6、用户界面中;流程图路径和CRF路径请输入完整的文件路径,包含文件拓展名;(

2022-02-08 14:57:38 705

原创 Python-Excel文件操作-Excel文件合并与拆分-GUI

#为防止相同sheet名称覆盖,合并后的sheet名称为原文件名+sheet名,但若总长度>34会报错,需注意。import excelformat2import pandas as pdimport tkinter as tkimport osimport openpyxlimport re#合并函数---------------------------------------------------------------------------------------------

2021-12-27 11:29:39 431

原创 Python-Excel文件操作-Excel文件比对-GUI

通过构建GUI用户界面,获取要比对文件的路径和忽略(不进行比对)的列名,比对采用双循环查找另一文件中是否存在完全相同的行的方式,找到则一致,未找到则不一致,比对结果输出在最后一列;#导入所需库import tkinter as tkimport tkinter.messageboximport threadingimport excelformat2#函数定义---------------------------------------------------------------------

2021-12-27 11:26:55 558

原创 excel添加超链接

from openpyxl import Workbook,load_workbookwb=load_workbook(r'C:\Users\s\Desktop\设置单元格格式\SCT-I10A-B301-LABAE-2.xlsx') #载入excel文件,仅支持.xlsxprint(wb.sheetnames) #取所有sheet名称lb1=wb['血常规'] #获取一个sheetlb1['A1'].value='=hyperlink("#血生化!A1","mingcheng")'..

2021-08-29 11:08:04 150

原创 Python 设置excel边框、背景填充色、字体颜色、对齐方式、设置超链接(openpyxl)

导入所需的库from openpyxl import Workbook,load_workbook #导入所需的库from openpyxl.styles import *from openpyxl.utils import get_column_letter, column_index_from_string #列字母数字互相转换,调整行高列宽需使用读取现存.xlsx文件wb=load_workbook(r'C:\Users\s\Desktop\设置单元格格式\SCT-I10A-B301-L

2021-07-07 10:13:40 4282

原创 python批量创建文件夹

#批量创建文件夹,from_path变量为存储待创建文件夹名称的excel文件。def creatdir (from_path): import os import pandas as pd name=pd.read_excel(from_path) print(name['编号'].values) for i in (name['编号']): os.makedirs(r'C:\Users\s\Desktop\核查条目\{}'.format(i))

2021-05-07 09:56:30 189

原创 python合并excel文件

import pandas as pdimport osdir_list=os.listdir(r'C:\Users\s\Desktop\I10A-B301\B301人工核查\数据集分类合并\核查条目') #读取核查逻辑的文件名for i in (dir_list): result=pd.ExcelWriter(r'C:\Users\s\Desktop\I10A-B301\B301人工核查\数据集分类合并\output\SCT-I10A-B301-{}-SYL20200520.xls'.

2021-05-07 09:53:06 58

原创 python用于临床数据管理_超窗判断

#V7给药开始日期-V6给药开始日期=7±3天,17行更改要核查的周期,44行修改对应的窗口期时间。import openpyxlwb=openpyxl.load_workbook(r'C:\Users\s\.spyder-py3\TE0.xlsx')ws=wb['EX_给药记录']rows=ws.rowsa1=[] #存储‘给药记录’中受试者编号列a2=[] #存储‘给药记录’中访视列b1=[] #存储‘给药记录'给药开始时间列d31=['01','03','05','07',

2021-05-07 09:50:17 220

原创 python用于临床数据管理_LB-AE核查

import tkinter as tkfrom tkinter.filedialog import askopenfilenameimport re#设置GUI-----------------------------------------------------------------------path1='NA' #datalisting路径path2='NA' #输出路径def hit_b1(): global path1 path1=askopenfilenam

2021-05-07 09:32:15 291

原创 python用于临床数据管理_AE查重脚本

# -*- coding: utf-8 -*-"""Created on Thu Dec 24 14:00:01 2020@author: s"""import reimport openpyxlimport pandas as pdfrom openpyxl.styles import Font,PatternFill,Side,Alignment,Borderfrom datetime import datetimedef AE_dup(filename): imp

2021-05-06 15:29:39 259

原创 正则表达式

^ 匹配字符串的开头$ 匹配字符串的末尾。. 匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符的任意字符。[…] 用来表示一组字符,单独列出:[amk] 匹配 ‘a’,‘m’或’k’[^…] 不在[]中的字符:[^abc] 匹配除了a,b,c之外的字符。re* 匹配0个或多个的表达式。re+ 匹配1个或多个的表达式。re? 匹配0个或1个由前面的正则表达式定义的片段,非贪婪方式re{ n} 精确匹配 n 个前面表达式。例如, o{2} 不能匹配 “Bob” 中

2021-05-06 15:19:42 96

原创 windows添加环境变量Path的方法

CMD中输入:path +空格+路径 即可

2021-05-06 15:17:34 573

原创 pandas笔记

pandasimport pandas as pddf=pd.read_excel(filepath,header=1,index_col='id') #读取excel文件,可用header参数指定列标题所在的行;不加默认第一行为列标题;header=None则默认不设列标题,适用于无标题的数据表,然后通过df.columns=['a','b']设置列标题;index_col可以设置以哪一列作为index,也可读取后使用df=df.set_index['id']后期设置index;写入文件时index

2021-04-24 18:57:29 71

原创 Python Pandas使用df.loc直接修改每一行列的值

使用dataE[‘Subject’][i]=x的方式会报错,如需赋值可使用df.loc[row,col]的方式。将四位的编号补齐为5位:for i in range(len(dataE)): if len(str(dataE['Subject'][i]))==4: dataE.loc[i,'Subject']='0'+str(dataE['Subject'][i])...

2021-04-16 16:37:00 2662

原创 Python Pandas读取CSV文件

1、读取CSV文件若正常读取出错尝试加入以下参数```pythondataE=pd.read_csv(r'C:\Users\s\Desktop\B301免疫原性一致性核查\xx.csv',encoding='UTF-16',sep=None,engine='python')

2021-04-16 16:15:12 508

原创 Python Pyinstaller 打包为.exe

在要打包的py文件路径输入以下cmd命令:Pyinstaller -F xxx.py 若某些关联库没有打包进来,需要手动添加库的路径:Pyinstaller -F xxx.py --hidden-import 库路径\库名例:Pyinstaller -F metrics.py --hidden-import c:\users\s\appdata\local\programs\python\python35-32\lib\pandas.py...

2021-04-03 17:14:10 57

原创 Windows 安装pip

python 3.4以后版本已自带pip,若无法使用请在CMD中使用以下command:python -m pip install --upgrade pip --force-reinstall

2021-04-03 17:09:58 127

原创 Python设置excel单元格格式(填充、边框、根据首行内容自动调整列宽)

设置单元格格式import openpyxlfrom openpyxl.styles import Font,PatternFill,Side,Alignment,Borderdef reset_color(filename): wb=openpyxl.load_workbook(filename) fill=PatternFill( #设置填充样式 fill_type='solid', start_color='99ccff') borde

2021-04-03 16:54:10 2889 2

原创 Python pandas 将多个dataframe写入同一个excel文件

使用pd.ExcelWriterwriter=pd.ExcelWriter(r'C:\Users\s\Desktop\I10A-B301\B301人工核查\新增核查20210403\SCT-I10A-B301 output.xlsx')data.to_excel(writer,sheet_name='sheet1',index=False)data2.to_excel(writer,sheet_name='sheet2',index=False)writer.save()...

2021-04-03 16:39:30 1542

原创 Python DataFram 判断是否为nan的两种方法

1、根据是否与自身相等判断是否为nan:nan是一个代表“不是一个数字”的变量,不代表某一具体值,因此变量nan!=nan,可根据此属性判断某一值是否为nan。构建一个含有nan的DataFrame:import numpy as npimport pandas as pdfrom numpy import nandata=pd.DataFrame(np.arange(16).reshape(4,4),index=list('abcd'))data.iloc[0:3,0:3]=nanpri

2021-04-03 16:25:39 12566 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除