当前页面是本站的「Google AMP」版。如遇图片显示错误,或发表评论请点击:完整版 »
GSDS 是由北京大学生物信息学中心提供的用于显示基因外显子、内含子、保守元件的组成和位置的一个在线服务,全英文界面。由于有些地方不是很好操做,这里把我的步骤列在下面。
sequence (FASTA)格式
GSDS 2.0 目前提供四种格式:BED、GenBank Accession Number or GI、GTF/GFF3 和 sequence (FASTA)。前三种我都不会,所以不讲。
选中 sequence (FASTA) 格式后,要求上传 CDS sequence (FASTA) 和 Genomic sequence (FASTA) 两种文件。
1. 获取 CDS sequence (FASTA)
CDS sequence (FASTA) 可以批量获取。打开 NCBI Batch Entrez,选择Protein,上传登陆号文件,具体参考 这个 。旁边 Send to 的时候选择 FASTA CDS 就可以。
2. 获取 Genomic sequence (FASTA)
而 Genomic sequence (FASTA) 获取就较为繁琐,目前我还不知道有啥不用脚本就可以批量下载的方法。超费时间的手动获取方法流程如下:点击列表,进入单个基因详情页
点击右下 FASTA,获取 DNA FASTA,复制结果,粘贴保存到同一个文件里
下拉,找到 mRNA and Protein(s) 这一栏,对应的是蛋白质登陆号。
那么在详情页里获取到的必要信息有:LOC105628049
JCGZ_05469
NW_0121