今天和大家讨论几种序列比对的应用场景,
当然只是抛转引玉,如果小伙伴有其他应用场景,欢迎讨论
一、物种/基因的进化
二、基因组学
2.1 比较基因组学揭示保守区
2.2 比较基因组学揭示功能元件
例如上图的基因外显子对老鼠、鸡、鱼都非常保守
2.3 全基因组比对揭示直系同源片段
2.3 相关算法
- 计算替换和间隙的数量
- 估计突变的数量(包括反向突变的估计)
- 扫描保守区
- 估计受约束的“隐藏状态”的概率:HMM
- 使用系统发育来估计树突变率
- 允许树的不同部分有不同的比率:系统发育学
三、不同功能的进化特征
3.1 蛋白质编码基因
- 密码子替换频率
- 开放阅读框的保守性
3.2 RNA结构
- 补偿性变化
- G-U替换
3.3 microRNAs
- 结构特征:loops,pairs
- 与3’UTR基序的关系
3.4 调控基序
- 突变
- 保守性
四、引物设计
做湿实验的小伙伴常用技能
五、参考基因组比对
应该是大家最常用的一种,将 reads 比对到参考基因组。
每个比对软件都有自己的一套比对算法,详细可以参考 bowtie2,hisat2,star 的官方文档。
如果感兴趣可以去我博客转转:
STAR(测序序列与参考序列比对)https://zhenglei.blog.csdn.net/article/details/118738774
bowtie2(测序序列与参考序列比对)https://zhenglei.blog.csdn.net/article/details/79833969
生物信息之多序列比对,进化树分析,保守位点分析 https://zhenglei.blog.csdn.net/article/details/78506951
从水果连连看到两条序列比对 https://zhenglei.blog.csdn.net/article/details/120933936
参考:
Machine Learning for Genomics (2020)
Deep Learning in the Life Sciences (2021)
《生物信息学》(樊龙江)