ncbi查找目的基因序列_技能篇 | NCBI的5种常见使用方法(二)

上期回顾:技能篇 | NCBI数据库使用教程(一)


一、查找基因序列、mRNA序列

进入NCBI 主页,在 search 后面选择 Gene,输入需要查找的基因的名字,点击search,查看结果。

以基因P53为例,搜索结果如图:

8d4c7d328bf2fcdf852d217180180043.png

点击红框部分,进入并下拉,可以看到大量的信息,如下图:

9dfc121bdb07c0a391785b376c0fcab0.png
d50013df5eb363b11c747cc557b65d42.png

二、用Probe查找已经公布的引物序列

进入NCBI主页,在下拉菜单选择Probe之后填写需要查找的基因名称。

1851ec386f4cdf2d36feaeccbf3307e1.png

点击search,出现下面界面:

fe25e333c80e8038cec94c7eb4f31618.png

点击第一个链接,序列结果如下图所示:

515962fa994b1a8788e097b74831ab79.png

三、上传数据到NCBI

NCBI对可提交的数据类型有详细列表,不同类型的数据分别提交到不同的数据库。

具体可查看:

http://www.ncbi.nlm.nih.gov/guide/howto/submit-sequence-data/

d82abf58652a45b4e00eab08b3361d10.png

由于测序平台应用在不同类型的项目长会有不同分析结果,所以分析数据的提交要根据测序项目类型来定。

1. 建立一个属于自己的NCBI登录账户,用以提交数据。

打开下方链接:

https://www.ncbi.nlm.nih.gov/account/

点击图中标注的“Register for a NCBI account”,进入到注册页面,如实填写信息;

fbaa16c198694c96f010d2b0d29028ac.png

如何创建My NCBI账户,也可详细见:

http://www.ncbi.nlm.nih.gov/books/NBK3842/#MyNCBI.Registering_with_My_NCBI

2. 为提交的数据申请BioProject和BioSample号。

一个BioProject代表一项测序研究项目,它可包含多次实验(experiments):

Step1:打开

https://submit.ncbi.nlm.nih.gov/,点击“BioProject”进入新建页面;

Step2:点击“New submission”,进行提交;

Step3:根据研究项目实际情况,填写一系列信息,每填写完一个步骤,都要点击页面下方的continue,保存已填写的信息。点击“submit”即可;

3. 在NCBI网站上登录自己的账户,进入数据提交的Submit界面后,点击相应的数据库进行数据的提交。(

https://submit.ncbi.nlm.nih.gov/)


四、如何用NCBI批量下载基因序列

1. 登入NCBI主界面,在下拉菜单里选择nucleotide,将基因的Accession number都排列在一起,用空格隔开,不要有回车符;

例如:NM_181571 NM_012319 NM_016651 NM_007678NM_004642 NM_145918 NM_024504 NM_014847 NM_004196 NM_002295:

200dab1cb1e71dc6ec2a38f3f735f953.png

填好后Search,然后会出现这样一个界面:

e449723ffa0de9ab3ebae06eceec3954.png

2. 点击上面的summary下拉标记,在Format选项中选择FASTA;

ba589604e94c1764f8147336f3cea830.png

点击Apply,就会出现下一个界面:

fb3b2b6eaba26560aff972a504510946.png

3. 点击右上角的Send下拉标记,选中CompleteRecord和File,然后在下面Format中选择FASTA,Sort by不变(默认),最后点击Create File保存数据即可;

70f9540904dc814e4117e45cede10394.png

五、如何用NCBI下载物种的全基因组序列

1. 打开NCBI,在下拉栏里选择Genome,之后输入下载物种的拉丁名;

以拟南芥Arabidopsis thaliana为例:

搜索结果如下图所示:

020ffa8aa9530088cb6008a2fe124198.png

2. 点击上图的“GenomeAssembly and Annotation report”进入下面的界面:

5ccbfd88de9d641dbcb71a6ce940f602.png

一般来说,选择level这一列中测序水平最高的一组就是黑色部分占据面积最多的。

3. 点击Assenbly这一列中的基因组编号,可进入全基因组下载界面;

5976b8ebe91b77ebae46e1be0142aceb.png

4. 点击该界面的右侧,即可进行全基因组的下载;

65e9fd5b598a3db1ed8ad890e607590e.png

参考资料

https://wenku.baidu.com/view/f86d817165ce0508763213df.html

https://www.cnblogs.com/yahengwang/p/9550410.html

https://mp.weixin.qq.com/s/7EPj0lJGz2gesnLK_k_oGg

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值