![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘/机器学习
guomutian911
这个作者很懒,什么都没留下…
展开
-
【通俗易懂】层次聚类算法的原理及实现
层次聚类(Hierarchical Clustering)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中,不同类别的原始数据点是树的最低层,树的顶层是一个聚类的根节点。创建聚类树有自下而上合并和自上而下分裂两种方法,本篇文章介绍合并方法。层次聚类的合并算法层次聚类的合并算法通过计算两类数据点间的相似性,对所有数据点中最为相似的两个转载 2017-05-27 17:21:44 · 3483 阅读 · 1 评论 -
关于RNA-seq数据集的小结
关于数据集的小节:1、reads:测序得到的小片段(类似:ATCCTA..GCTA)2、counts:与已知序列(基因)比对上的reads个数(为整数,可能是个位数也可能是几千,与基因表达情况和测序深度有关)3、由于不同基因的reads长度不同,从统计角度上看,需要采用FPKM或RPKM来排除随机抽样带来的偏倚。并且,不同的测序深度,直接影响counts的个数。4、通常,如果数据集原创 2017-09-21 10:30:56 · 3869 阅读 · 0 评论 -
【图解】机器学习
参考文章:https://my.oschina.net/taogang/blog/1544709演示代码:https://codepen.io/collection/DPWwaj/每当提到机器学习,大家总是被其中的各种各样的算法和方法搞晕,觉得无从下手。确实,机器学习的各种套路确实不少,但是如果掌握了正确的路径和方法,其实还是有迹可循的,这里我推荐SAS的Li Hui的这篇博客,讲原创 2017-11-04 21:45:44 · 579 阅读 · 0 评论 -
【结合实例】信息增益的计算
参考文章:https://www.cnblogs.com/qcloud1001/p/6735352.html信息增益原理介绍介绍信息增益之前,首先需要介绍一下熵的概念,这是一个物理学概念,表示“一个系统的混乱程度”。系统的不确定性越高,熵就越大。假设集合中的变量X={x1,x2…xn},它对应在集合的概率分别是P={p1,p2…pn}。那么这个集合的熵表示为:原创 2017-11-22 09:53:09 · 59277 阅读 · 9 评论 -
SPSS学习笔记之——两独立样本的非参数检验(Mann-Whitney U )
参考文章:http://blog.sina.com.cn/s/blog_83d9188c0102xjbz.html对于8个单细胞转录组数据集,用NMI和SE算法聚类,得到ARI和NMI评估指标:统计上述8个数据集的ARI和NMI均值,作为NMI和SE聚类的性能评估,但均值可能是随机采样导致的结果更优,如果要严格说明需进行统计学分析,如Mann-Whitney U等统计方法,如果得到pval...原创 2019-01-07 22:50:21 · 35627 阅读 · 0 评论