- 博客(78)
- 收藏
- 关注
原创 python函数的传参
这里的kargs是一个字典,但传入的参数是 '**kargs', 而非 'kargs'.因为此时传入的cc会被当成一个position argument。定义一个接受关键字参数的函数。那么怎么传这个字典呢?
2023-08-11 00:51:02 436
原创 samtools flags 查看flags
samtools flags 1294$samtools flags 12940x50e 1294 PROPER_PAIR,UNMAP,MUNMAP,SECONDARY,DUP$samtools flags 2560x100 256 SECONDARY$samtools flags MUNMAP0x8 8 MUNMAP$samtools flags UNMAP0x4 4 UNMAP$samtools fl
2022-05-26 15:32:27 348
原创 pandas的DataFrame的一个问题
尽量不要用以下方式更新一个DataFrame:df.loc[idx] = Lst如果要更新df, 我宁愿将新的列用list先存起来,然后用pd.concat()一次性更新,尽量不要用df.loc[idx]这种方式,否则会非常慢。
2022-04-11 01:47:19 1113
原创 安装htslib
msisensor-pro: error while loading shared libraries: libhts.so.3: cannot open shared object file: No such file or directory在测试msisensor-pro时候,发现libhts.so.3找不到。判断libhts.so.3应该属于htslib库。于是安装一个。https://leoatchina.github.io/2017/08/26/install_samtool
2022-02-12 20:31:28 1819
原创 conda env
$conda info --envs# conda environments:#base * /home/wubin/miniconda3DECoN /home/wubin/miniconda3/envs/DECoNSnakeMakeEnv /home/wubin/miniconda3/envs/SnakeMakeEnvcnvkit /home/wubin/mi.
2022-02-08 12:26:46 478
原创 perl里面变量的defined与TRUE
#!/usr/bin/perl -wuse strict;my ($a,$b,$c,$d) = (1,2,"");if($c){print "\$c is true\n";}if(defined $c){print "\$c is defined\n";}if($d){print "\$d is true\n";}if(defined $d){print "\$d is defined\n";}
2022-01-10 19:00:45 283
原创 python 遍历某个目录
这个会不断刨根问底for root, dirs, files in os.walk(in_dir): #这个会刨根问底 for file in files: file_path = root + '/' + file print(file_path)这个不会刨根问底:for i in os.listdir(in_dir): file_path = in_dir + '/' + i print(file_path)...
2021-12-23 20:55:07 427
原创 pandas处理合并单元格
# https://blog.csdn.net/weixin_36360005/article/details/112208014 pandas处理合并单元格
2021-12-23 01:26:20 5821
原创 pandas DataFrame的分类汇总
df = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar','foo', 'bar', 'foo', 'foo'], 'B' : ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'], 'C' : np.random.randn(8), 'D' : np.random....
2021-12-15 15:52:23 2445
原创 numpy存储数据
np.save('Stat.npy',data_frame_all) np.save('columns.npy', data_frame_all.columns) ndarray = np.load('Stat.npy', allow_pickle=True) columns = np.load('columns.npy',allow_pickle=True) # print(type(columns)) # print(ndarray.ndim) ...
2021-12-15 11:55:50 1036
原创 pandas写入excel
from openpyxl.writer.excel import ExcelWriterwriter = pd.ExcelWriter(outfile) # 生成一个句柄对象sample_stat_no_correct.to_excel(writer,sheet_name='未修正样品数',index=False,freeze_panes=(1,2))sample_stat_correct.to_excel(writer,sheet_name='修正后样品数',index=False,f...
2021-12-15 11:43:25 719
原创 pandas的一个诡异之处(SettingWithCopyWarning)
原代码:def change_to_date_format_backup(data_frame, head): for idx in data_frame.index: value = data_frame.loc[idx, head] if pd.isnull(value): # NaT 也会是datetime.datetime pass elif value == '-': # 这种待修改 .
2021-12-14 02:44:28 791
原创 python字典的update,慎用
Dict = {}Dict2 = {}Dict['China'] = {}Dict2['China'] = {}Dict['China']['area'] = 960Dict2['China']['population'] = 14Dict.update(Dict2) #Dict的‘area’key会被 'population'覆盖掉for i in Dict['China']: print(i)#Dict的‘area’key会被 'population'覆盖掉.
2021-12-06 11:22:43 1315
原创 pandas的一个诡异之处
aa = pd.DataFrame(np.arange(28).reshape(4,7),columns=['A','B','C','D','E','E','G'])aa.loc[4] = [0,0,0,0,0,0,0]aa.iloc[2,6] = 20.53print(aa)上面的aa的columns中,‘E’是重复的,会有错但假如不修改成浮点数,也不会报错:aa = pd.DataFrame(np.arange(28).reshape(4,7),columns=['A','..
2021-11-30 01:07:42 495
原创 python时间操作
from datetime import datetimefrom dateutil.relativedelta import relativedelta#=========================================================================#从字符串转为datetime对象,format与bb必须严格匹配bb = '2021-11-18 23:15:16'cc = datetime.strptime(bb,'%Y-%m-%d %H:.
2021-11-18 23:53:01 422 1
原创 snpSift的吊诡之处
1. 用作测试的数据库vcf文件:database_test.vcf##fileformat=VCFv4.1##fileDate=2021-11-06##source=Inhouse##reference=GRCh37##ID=<Description="Variation ID">##INFO=<ID=TEST,Number=.,Type=String,Description="the code representing an annotation">#CHRO.
2021-11-07 01:04:58 332
原创 transvar使用汇总
输入格式#chr11:51515698_51515699dupTG#chr11:51515699_51515700insTG#chr14:75498786_75498787insT#chr14:75498786delT#NM_014381.2:c.3742dupA#NM_014381.2:c.3742delA#NM_014381.2:c.3740A>C#用基因组坐标而不用c.XXX作为输入信息的原因#transvar不接受c.3742dupA之类含有dup的输入...
2021-11-05 23:56:34 770
原创 samtools index的一个坑
今天被自己坑了一把。samtools index a.bam b.bam上面这样写,b.bam将是a.bam的bai文件。如果写作samtools index a.bam则会生成一个a.bam.bai文件,这个a.bam.bai文件的md5值会与b.bam一模一样
2021-10-26 23:52:34 2744
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人