聚类分析-K-means clustering 在生物信息学中的应用

最新推荐文章于 2023-11-11 22:05:52 发布

荞麦agan

最新推荐文章于 2023-11-11 22:05:52 发布

阅读量3.9k

点赞数

分类专栏：生物信息学文章标签：生物信息学数据分析生物学

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aganlala/article/details/113628848

版权

聚类分析-K-means clustering 在生物信息学中的应用

聚类是一种涉及数据点分组的机器学习技术。给定一组数据点，可以使用聚类算法将每个数据点到分类到图像中的特定组中。理论上，同一组中的数据点应具有相似的属性和特征，而不同组中的数据点的属性和特征则应高度不同。聚类是无监督学习的一种方法，是用于多领域统计数据分析的常用技术。在生物学领域，有效地将不同的基因序列集进行有效的分类、功能基因识别、对蛋白质物理化学性质进行聚类可以预测其功能，推导植物和动物的分类，推断出物种的系统发育树，获得对种群固有的结构认识等，成为后基因组时代功能基因研究的重要工具。由于聚类分析应用的广泛性，出现了大量可用的聚类分析软件。常见的聚类分析方法有 K-means clustering，以及Hierarchical Clustering （层次聚类）。

K-means clustering 简介

K-means由于其简单，好理解，运算速度快的优点，是一种非常常见并且应用很广泛的聚类分析方法。k-means的分析原理如下：首先任取k（分析人员自己设定）个样本点作为k个簇的初始中心，也就是数据集经过聚类得到k个分组；然后对每一个样本点，计算它们与k个中心的距离，把它归入距离最小的中心所在的簇；等到所有的样本点归类完毕，重新计算k个簇的中心；重复以上过程直至样本点归入的簇不再变动（收敛）。这样就将所有的样本划分成了k个组。

K-means聚类分析方法已被成功地应用于生命科学中各领域的研究，如在生物信息学分析中，K-means聚类分析常用于聚类基因表达数据、聚类蛋白质序列、构建系统发育树等。如蛋白质序列

最低0.47元/天解锁文章

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

荞麦agan CSDN认证博客专家 CSDN认证企业博客

码龄4年

94: 原创

4万+: 周排名

131万+: 总排名

59万+: 访问

: 等级

2437: 积分

270: 粉丝

162: 获赞

30: 评论

1206: 收藏

私信

关注

热门文章

分类专栏

最新评论

转录组-蛋白组-代谢组关联分析
YAD923: 太有用了
KEGG 通路富集分析图解
早起早睡er: 你好，这个结果还需要筛选显著通路吗，如果筛选的话，是以pvalue还是adjust p呢
miRNA与转录组联合分析
shizuka0420: 想问问为什么正相关基因用GO，负相关基因用KEGG呀
KEGG 通路富集分析图解
荞麦agan: pvalue的值越小，代表富集程度越显著，您说的pvalue为0，在我这个图里面，那就是越接近红色
KEGG 通路富集分析图解
star_cyan: 老师您好，我有几个通路的pvalue为0，做出来的泡泡是灰色的，请问这是不是说明这灰泡泡比您图上的紫色泡泡更具有相关性呢？（主要看了一些论文，没有发现有这种情况的），谢谢老师

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。