- 博客(5)
- 收藏
- 关注
原创 正则表达式练习
把这段文字: - 取出其中的参考文献 - 输出去掉参考文献之后的文本 Large, randomized Phase 3 trials in colorectal cancer have found that panitumumab, when combined with chemotherapy, results in prolonged progression-free survival
2017-07-30 17:54:38 368
原创 生物信息脚本练习(4)按照行列合并文件
这是个新的需求,要求把如下的两个2X5 的文件合并成一个3X5 的。 Program2_1.txt Seq Length cog4 210 cog2 94 cog3 210 cog1 113 cog5 152 Program2_2.txt Seq Depth cog5 93 cog1 110 cog2 114 cog4
2017-07-30 16:01:58 461
原创 生物信息脚本练习(3)gb文件转换
这是个genebank的序列文件 https://www.ncbi.nlm.nih.gov/nuccore/NC_000012.12?report=genbank&from=25204789&to=25252093&strand=true这个文件需要转换成fasta格式的文件,脚本如下:import reoutput = open("data3.txt","w") with open("
2017-07-30 15:56:16 1802 2
原创 生物信息脚本练习(2)求反向互补序列
这是一个简单的生信脚本练习,对一段碱基序列切片,然后求反向互补序列。注意其中join 函数的用法#求反向互补序列lll = []with open("Program1.txt","r") as f: seq = f.readlines() seq = seq[1] print(seq) print("\n") seq = seq[50:101] pr
2017-07-30 15:41:29 3101
原创 生物信息脚本练习(1) 找出fasta文件中大于500的序列
最近做了一些生物信息的脚本练习。 这是第一个例子。 找出一个fasta文件中大于500的序列,并重定向到另一个新的文件中。 这个文件每条序列是如下的样子。 c100027.graph_c0|orf3 type=complete len=150nt loc=c100027.graph_c0:123-272:- ATGAGGATCTTTACGCCAAATGAGGGCCTTGTTGTTGA
2017-07-30 15:38:05 3877 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人