pandas dataframe的一个技巧

import sys,os,re
import numpy as np
import pandas as pd

from glob import glob


#实际路径:/mnt/lustre/user/wubin/03.Clinical_Data/16.EQA/2022_solid_tumor/no_split
os.chdir('M:/')

file_lst = sorted(glob('*.all.snv_indel.eqa.HGVS.xls'))

df_all = pd.DataFrame() #定义一个空的DataFrame

for file in file_lst:
    df = pd.read_csv(file,sep='\t')
    sample = file.split('.')[0]
    sample = re.sub('^22SSP0', '', sample)
    df.insert(0, '样本编号', sample)
    df_all = pd.concat([df_all,df],ignore_index=True)
    

df_all.to_excel('E:/XXXX/SNV_INDEL.xlsx',
                index=False,
                freeze_panes=(1,1))


df_all = pd.DataFrame() #定义一个空的DataFrame

这个用法很好,连columns都不用预先定义

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值