生物信息
文章平均质量分 62
Javis486
天下皆白,唯我独黑
展开
-
BWA0.7+Samtools1.5+GATK4.0在小数据集上的试验
试验数据 chr14_1.fastq chr14_2.fastq (1.47G each one .gz) chr14.fasta (28M .gz) chr14.fastq文件可以在GAGE下载 chr14.fasta文件可以在UCSC下载软件的版本: bwa-0.7.17 gatk-4.0.2.1 samtools-1.5 试验过程1.生成索引文件bwa i...原创 2018-03-13 15:03:30 · 3417 阅读 · 2 评论 -
Aspera从NCBI下载基因组数据
1.下载/安装Aspera 下载地址:http://downloads.asperasoft.com/en/downloads/8?list 选择对应的版本,我用的是centos7_x64服务器,安装文件aspera-connect-3.7.2.141527-linux-64.sh 使用普通用户进行安装sh aspera-connect-3.7.2.141527-linux-64.s...原创 2017-06-07 17:33:00 · 12962 阅读 · 6 评论 -
BWA0.7+Samtools1.5+GATK4.0在大数据集上的试验
试验数据 fasta:hg38.fa文件可以在UCSC下载 (hg38.fa.gz 938M) fastq非公开文件KY18011403DNA_DHG18153-V_AHHVVHCCXY_L7_1.fq 35GKY18011403DNA_DHG18153-V_AHHVVHCCXY_L7_2.fq 35GKY18011403DNA_DHG18153-V_AHHVVHC...原创 2018-03-21 08:42:45 · 2273 阅读 · 0 评论 -
本地使用Python通过染色体id+位置查询基因名列表
简介通常使用bwa做mapping后会获得sam文件,而sam文件包含2个重要的字段:该序列mapping上的染色体id和位置(比如第2列(chr5)和第3列(36345037))KMER_44 0 chr5 36345037 37 7M1D24M * 0 0 CTGATGCAAAAAAAAAAAAGCTTTTTTG...原创 2018-10-18 16:00:11 · 4890 阅读 · 2 评论 -
在线使用Python通过染色体id+位置查询基因名列表
前话:使用pyensembl可对hg38进行本地查询,但发现若查询其他的数据库比如hg19,得重新下载对应的数据文件。查看文献发现,UCSC提供了一个丰富的mysql数据库供我们在线查询各种生物的信息(其中就包括hg19和hg38).UCSC提供的mysql连接字符串(需安装mysql客服端,其中-A=不预加载数据库)mysql --user=genome --host=genome-mys...原创 2018-12-09 10:06:49 · 5588 阅读 · 6 评论