![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
生信脚本
每天都要学Python
每天都要学Python!!!
展开
-
【Python】利用滑动窗口计算全基因组每个窗口上CNV的拷贝数和Vst
目录Vst介绍计算每个窗口的绝对拷贝数1.文件准备2.编写脚本计算每个窗口的VstVst介绍Vst是通过计算拷贝数的方差来衡量不同群体之间CNV的分化的一个指标,类似于Fst的概念,可以用来鉴定一些高分化的区域。计算方法如下:Vpop1是指群体1的copy number的方差;Vpop2是指群体2的copy number的方差;Vtotal是全部个体的copy number的方差;Npop指的对应群体的个体数。部分文献中,会按照10K的窗口,2K的步长,去计算全基因组上每个窗口的Vst。而原创 2020-05-15 17:23:23 · 3134 阅读 · 5 评论 -
提取每条fasta序列的前500bp【Python】
最近看到同学用Perl写了一个提取fasta序列前500bp的脚本,于是自己用Python也写了一个实现相同功能的脚本。脚本内容如下:"""@author: will@Date: July 2019@E-mail: willgyw@126.com@Description: """import sysseq = {}res = open('500bp.fa', 'w')...原创 2019-07-03 22:07:20 · 1365 阅读 · 0 评论 -
利用pandas获取表格中每一行数据的最大值【python】
pandas可以说是python当中的表格处理神器,利用pandas可以实现很多使用的功能,下面脚本就是利用pandas找出每一行数据的最大值。脚本一import pandas as pddf = pd.read_csv('all_rc.tsv', index_col=0, header=0, sep='\t')output=open('out.tsv','w')for i in ran...原创 2019-04-27 21:42:55 · 19723 阅读 · 0 评论 -
从fastq文件中批量提取/过滤序列【python】
博主也是刚刚接触生信,会将自己平时练习用到的python脚本发布到博客上,用来记录自己的学习之路。介绍测序回来的fastq文件通常在分析之前,需要进行过滤,该脚本利用python实现从压缩的fastq文件中提取指定ID的序列,并保存为新的压缩格式的fastq文件。说明输入文件为fq.gz文件,压缩的ID list文件。必须是压缩格式的文件才可以,如果非压缩格式,可以压缩成gz格式后...原创 2019-03-09 18:10:58 · 9713 阅读 · 3 评论 -
根据ID从FASTA文件中批量提取序列【Python脚本】
博主是一个刚刚接触生信的新手,正在学习Linux和Python,偶尔会在该博客上面发布自己练习编程写的脚本,用来记录自己的学习之路。介绍根据序列的ID号从FASTA文件中批量提取序列是在平时常常要做的工作,Linux当中grep和awk工具、Perl语言和Python语言都可以实现,以下是博主用Python实现的从FASTA文件中批量提取序列的脚本。说明需要用到fasta文件和ID的...原创 2019-02-27 19:21:11 · 12993 阅读 · 8 评论