基因碱基序列研究

基因序列的研究让我感到这几年的重视性,无论是在nature,还是science,以及各种的论文所有的影响因子都是最高系列,能有这么大的提升,主要是对数据有了突破,提取的精度,存储的高效,公开库的研究,可视化的研究,人工智能的发展,这次承担的任务还是以数据分析的角色来看待,淘金发文。

基因序列的研究让我感受到不仅仅是ATGC奇幻的排列顺序,以及他们针对这种数据存储的思考,利用,发觉,可视化,种种,还是讲些有意义的东西给大家科普。

 

 

RNA-seq 数据分析

1.检测测序数据的质量,如果需要,对数据进行预处理,去掉接头,去掉质量差的数据等等

2.将所有数据回帖到genome,根据结果,进行新基因或转录本的鉴定,然后对转录数据进行定量,并进行差异表达分析。也可跳过对3.新基因和新转录本的分析,只对已知的基因和转录本进行定量。如果没有参考genome数据,可以供transcriptome数据代替。如果参考转录组数据也没有,可以直接对RNA-seq数据进行从头组装,注释,作为参考转录组。

基因组常用的软件

Bowtie,Bowtie2,tophat2,BWA,HISAT2, STAR等

数据网站

NCBI (https://www.ncbi.nlm.nih.gov/grc)

UCSC (http://hgdownload.soe.ucsc.edu/downloads.html)

Ensemble (http://asia.ensembl.org/index.html?redirect=no)

注释文件

注释文件就是基因组的说明书,告诉我们哪些序列是编码蛋白的基因,哪些是非编码基因,外显子、内含子、UTR等的位置等等。

IGV软件

高效的查看基因组数据的可视化软件

这些专业的东西我都操作了一番,发现金子确实要交给数据挖掘工作者,淘金也很累,

使用IGV看序列比对情况  这个链接也能让你对数据工作者的一种其他见解

 

DNA数据特征

曲目、覆盖范围、下采样、对齐轨道、检测结构变体、个别基础的颜色和透明度、映射读取的透明度、插入、缺失、着色和排序对齐、配对末端对齐、查看作为对、映射配对读取的着色、染色体间重排、反演、倒置复制、串联复制、同一染色体上的易位、用亚硫酸氢盐模式解释颜色、拼接连接点

 

 

原本计划写很多的,但是内容不方便随意透漏,涉及我们的成果,你们就看最基础的就行了,

这些东西确实令人思考,尤其这方面再破解生命密码,我觉得可以做到,不过还是且切体会到,不同专业之间的交叉,以及综合学科的利用,真的能研究出大东西来,好好干吧,这个暑假争取多弄几个专利。

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值