NCBI数据库实用教程
NCBI数据库简介
NCBI,全称为美国国家生物技术信息中心(National Center for Biotechnology Information),是美国国家卫生研究院(National Institutes of Health)于1988年成立的部门。NCBI成立目的是为了促进生物医学研究,通过收集、存储和提供生物医学信息来加速科学和健康进步。
NCBI收录全世界所有实验室测序过的核酸信息,包括宏大的“人类基因组计划”测序结果、小鼠等所有物种的测序信息。此外,NCBI还提供许多功能强大的数据检索与分析工具(Analyze模块)。NCBI数据库包含多个子数据库,如GenBank核酸序列数据库、PubMed、PudMed Central、PubReader、Gene等,这些子数据库各有特点,如GenBank核酸序列数据库是NCBI维护的最大的公开数据库,收录了来自全世界实验室测序的核酸信息;PubMed是一个提供生物医学方面的论文检索以及摘要,并且免费搜寻的数据库;Gene数据库则提供了关于基因组组装结构等信息。
在NCBI数据库中,可以找到大量的生物信息学数据,包括DNA和蛋白质序列,基因组组装,基因注释,蛋白质结构等。这些数据对于生物学家和医学研究者来说非常重要。同时,NCBI还提供了强大的数据分析工具,如BLAST和COBALT,可以帮助用户对大量数据进行快速准确的分析。
NCBI数据库使用方法
网址:https://www.ncbi.nlm.nih.gov/
1
查找CDS和蛋白序列
进入NCBI网站,选择 “Gene” ,在search框中输入感兴趣的基因的名称、基因ID或相关的生物物种,以 “P53” 为例。
点击 “search” 按钮,系统会显示与您的查询相关的数据库条目列表,选择对应的物种,以 “human” 为例。
点击对应物种基因名,系统会显示与您的查询相关的数据库条目列表。包括基因的Summary、Genomic context和Genomic regions, transcripts, and products等。
在基因相关信息页面,下拉找到 “NCBI Reference Sequences(RefSeq)” 条目,在 “mRNA and Protein(s)” 里可以看到有不同的转录本,其中mRNA一般是 “NM” 开头,非编码RNA一般以 “NR” 开头,还有一种 “XM” 开头是生物信息预测的转录本。“NP” 开头表示蛋白质, “NC” 开头表示基因。
找到想要的 “NM” 开头的转录本号和 “NP” 开头的蛋白号,点击进入,即可看到基因详细信息。
下滑找到 “CDS” ,点击,即可看到CDS序列,可以直接复制或者点击右下角 “FASTA” 再复制。
蛋白序列同理,下滑找到 “Protein” ,点击即可直接复制或者点击右下角 “FASTA” 再复制。
2
查找基因的启动子序列
进入NCBI网站,选择 “Gene” ,在search框中输入感兴趣的基因的名称、基因ID或相关的生物物种,以 “P53” 为例。
点击 “search” 按钮,系统会显示与您的查询相关的数据库条目列表,选择对应的物种,以 “human” 为例。
向下翻动页面,找到 “Genomic context” 条目,此时注意查看基因的方向,P53基因方向为反向。
向下翻动页面,找到 “Genomic regions, transcripts, and products” 条目,点击 “FASTA” 。
进入基因序列详情页,在右侧 “Selected region” 选项中把from7668421to7687490改为from7687491to7689491(启动子序列一般默认为基因上游2000bp,由于P53基因方向为反向,而NCBI默认的基因方向为正向,故选择在基因位置最大值上加2001,若基因方向为正向,则选择在基因位置最小值上减2001)。
点击 “Update View” ,所得序列即为P53基因启动子区域序列。
3
查找基因的5’UTR和3’UTR序列
进入NCBI网站,选择 “Gene” ,在search框中输入感兴趣的基因的名称、基因ID或相关的生物物种,以 “GAPDH” 为例。
点击 “search” 按钮,系统会显示与您的查询相关的数据库条目列表,选择对应的物种,以 “human” 为例。
向下翻动页面,找到 “Genomic regions, transcripts, and products” 条目,点击 “Tools” 。
选择 “Tools” 中的 “sequence text view” 选项,点击后能看到基因的序列信息。
显示出来的结果应该怎么看?(这里标记的颜色是网站自动给出来的。)
蓝色标记序列代表的是5’UTR或3’UTR。红色标记序列代表的是外显子,因为外显子要翻译成氨基酸,所以下面会给出对应的氨基酸序列。绿色标记序列代表的是内含子,内含子不翻译,所以下面没有氨基酸序列。若没有显示出来完整的5’UTR或3’UTR,可以点左上角的 “Prev page” 或 “Next page” 。
因此,GAPDH这个基因的5’UTR序列如下****:
GCTCTCTGCTCCTCCTGTTCGACAGTC
AGCCGCATCTTCTTTTGCGTCGCCAG
3’UTR序列如下**:**
GACCCCTGGACCACCAGCCCCAGCAAGAGCACAAGAGGAAGAGAGAGACCCTCACTGCTGGGGAGTCCCTGCCACACTCAGTCCCCCACCACACTGAATCTCCCCTCCTCACAGTTGCCATGTAGACCCCTTGAAGAGGGGAGGGGCCTAGGGAGCCGCACCTTGTCATGTACCATCAATAAAGTACCCTGTGCTCAACCA
学习网络安全技术的方法无非三种:
第一种是报网络安全专业,现在叫网络空间安全专业,主要专业课程:程序设计、计算机组成原理原理、数据结构、操作系统原理、数据库系统、 计算机网络、人工智能、自然语言处理、社会计算、网络安全法律法规、网络安全、内容安全、数字取证、机器学习,多媒体技术,信息检索、舆情分析等。
第二种是自学,就是在网上找资源、找教程,或者是想办法认识一-些大佬,抱紧大腿,不过这种方法很耗时间,而且学习没有规划,可能很长一段时间感觉自己没有进步,容易劝退。
如果你对网络安全入门感兴趣,那么你需要的话可以点击这里👉网络安全重磅福利:入门&进阶全套282G学习资源包免费分享!
第三种就是去找培训。
接下来,我会教你零基础入门快速入门上手网络安全。
网络安全入门到底是先学编程还是先学计算机基础?这是一个争议比较大的问题,有的人会建议先学编程,而有的人会建议先学计算机基础,其实这都是要学的。而且这些对学习网络安全来说非常重要。但是对于完全零基础的人来说又或者急于转行的人来说,学习编程或者计算机基础对他们来说都有一定的难度,并且花费时间太长。
第一阶段:基础准备 4周~6周
这个阶段是所有准备进入安全行业必学的部分,俗话说:基础不劳,地动山摇
第二阶段:web渗透
学习基础 时间:1周 ~ 2周:
① 了解基本概念:(SQL注入、XSS、上传、CSRF、一句话木马、等)为之后的WEB渗透测试打下基础。
② 查看一些论坛的一些Web渗透,学一学案例的思路,每一个站点都不一样,所以思路是主要的。
③ 学会提问的艺术,如果遇到不懂得要善于提问。
配置渗透环境 时间:3周 ~ 4周:
① 了解渗透测试常用的工具,例如(AWVS、SQLMAP、NMAP、BURP、中国菜刀等)。
② 下载这些工具无后门版本并且安装到计算机上。
③ 了解这些工具的使用场景,懂得基本的使用,推荐在Google上查找。
渗透实战操作 时间:约6周:
① 在网上搜索渗透实战案例,深入了解SQL注入、文件上传、解析漏洞等在实战中的使用。
② 自己搭建漏洞环境测试,推荐DWVA,SQLi-labs,Upload-labs,bWAPP。
③ 懂得渗透测试的阶段,每一个阶段需要做那些动作:例如PTES渗透测试执行标准。
④ 深入研究手工SQL注入,寻找绕过waf的方法,制作自己的脚本。
⑤ 研究文件上传的原理,如何进行截断、双重后缀欺骗(IIS、PHP)、解析漏洞利用(IIS、Nignix、Apache)等,参照:上传攻击框架。
⑥ 了解XSS形成原理和种类,在DWVA中进行实践,使用一个含有XSS漏洞的cms,安装安全狗等进行测试。
⑦ 了解一句话木马,并尝试编写过狗一句话。
⑧ 研究在Windows和Linux下的提升权限,Google关键词:提权
以上就是入门阶段
第三阶段:进阶
已经入门并且找到工作之后又该怎么进阶?详情看下图
给新手小白的入门建议:
新手入门学习最好还是从视频入手进行学习,视频的浅显易懂相比起晦涩的文字而言更容易吸收,这里我给大家准备了一套网络安全从入门到精通的视频学习资料包免费领取哦!
如果你对网络安全入门感兴趣,那么你需要的话可以点击这里👉网络安全重磅福利:入门&进阶全套282G学习资源包免费分享!
