关闭

关于RNA-seq数据集的小结

关于数据集的小节: 1、reads:测序得到的小片段(类似:ATCCTA..GCTA) 2、counts:与已知序列(基因)比对上的reads个数(为整数,可能是个位数也可能是几千,与基因表达情况和测序深度有关) 3、由于不同基因的reads长度不同,从统计角度上看,需要采用FPKM或RPKM来排除随机抽样带来的偏倚。并且,不同的测序深度,直接影响counts的个数。 4、通常,如果数据集...
阅读(46) 评论(0)

【通俗易懂】层次聚类算法的原理及实现

层次聚类(Hierarchical Clustering)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中,不同类别的原始数据点是树的最低层,树的顶层是一个聚类的根节点。创建聚类树有自下而上合并和自上而下分裂两种方法,本篇文章介绍合并方法。 层次聚类的合并算法 层次聚类的合并算法通过计算两类数据点间的相似性,对所有数据点中最为相似的两个...
阅读(277) 评论(0)
    个人资料
    • 访问:348392次
    • 积分:5624
    • 等级:
    • 排名:第4877名
    • 原创:234篇
    • 转载:62篇
    • 译文:3篇
    • 评论:40条
    最新评论