Python学习
周欣5518
中科院微生物学博士
展开
-
用Pyhton批量改名FASTA文件
比如我们有个fasta格式的序列文件,里面的序列命名格式是点分隔的形式,MI.M03555.0272.001.FLD0001.WWMV01.20, 而我们真正想要的名字是WWMV01.20,那么在处理时我们只需要识别每一条序列中的第二个点就行,然后把第二个点前面,>符号后面的文字都删掉。>MI.M03555.0272.001.FLD0001.WWMV01.20AATACGTAGGGT...原创 2018-06-11 11:15:03 · 6781 阅读 · 0 评论 -
批量将fasta文件中序列名字改成对应文件夹名
更改之前的序列名,其文件夹名为C67>7_ITS1_W81010381TGTGACATACCTATACGTTGCCTCGGCGGATCAGCCCGCGCCCCGTAAAACGGGACGGCCCGCCCGAGGACCCCTAAACTCTGTTTTTAGTGGAACTTCTGAGTAAAACAAACAAATAAATCAAAACTTTCAACAACGGATCTCTTGGTTCTGG...原创 2018-10-23 09:14:51 · 6523 阅读 · 0 评论 -
一代测序序列数据批量聚类处理
首先我们将所有一代测序的序列文件都保存在同一个文件夹下,然后用cat命令合并成一个fasta文件。在每条序列第一行插入>for file in .fas; do sed -i “s/>./file” ; done将序列第一和第二行合并awk ‘{tmp=0}’ C1.fasvsearch —cluster_size all_fungi.fa \ —id 0....原创 2018-11-01 10:12:12 · 2181 阅读 · 1 评论