- 博客(3)
- 收藏
- 关注
原创 Misof-2014方法学习(三)
是通过估计大型数据集中的多个参数(通常是速率矩阵和字母频率中的所有条目,请参阅上面的 GTR 模型)来创建的。多个基因的变异速率存在差异,同一蛋白编码基因中编码同一氨基酸的三个位点的核苷酸的变异速率也存在差异,数据进行分区,分别计算不同区的最优模型,才能对这些位点设置其最优的核苷酸替换模型。根据 PSR 模型和 GAMMA 模型得到的树,都要根据 GAMMA 模型进行评分,当其中一方的整体对数似然得分明显更高时,使用得分更高的模型,当并没有明显的整体对数似然得分更高的模型时,将这两种模型都纳入分析。
2024-01-28 14:25:07 1649 1
原创 Misof-2014方法学习(二)
然而在真实的情况下, 不同生物的序列组成成分存在一定的差异, 如果分析的数据集在不同物种间存在较大的序列组成异质性, 则在构树过程中往往会将序列组成相似的物种错误地聚为一支, 与真实进化关系存在偏差。由于缺失数据在排列序列中的不均匀分布会影响树的重建,作者使用 AliStat(http://www/csiro.au/alistat)分析了超比对,并生成了序列成对比对的缺失数据分布热图,记录了这些序列对的缺失数据程度。质序列之间的比对进行评分。直接基于多序列比对分析亲缘关系较远的蛋白质,而不是用近缘的序列。
2024-01-24 10:47:30 1344 1
原创 Misof-2014方法学习(一)
注意要尽可能多的涵盖所有现生类群——所关注的阶元。(eg:长蝽总科研究时的科级阶元)每个科中包含多个代表物种,亚科阶元中尽量分布均匀,含有属数量较多的亚科可以视情况多取。关注系统发育位置或的类群。对样品进行定种,不能确定种的尽量确定属。(尽可能保存同一采集地点、同一形态形的同种样品作为二级凭证进行保存,二级凭证为干制标本或保存在>95%浓度的乙醇中。将标本保存在RNAlater中(RNAlater:样品比例 = 5:1)物种列表S1中为什么有许多个体数目>1?
2024-01-16 10:50:56 1141 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人