聚类，k-mean方法，基于密度的方法：DBSCAN，孤立点检测——数据分析与R语言 Lecture 10

CHEN_BR

于 2019-10-07 14:11:06 发布

阅读量786

点赞数

分类专栏： R

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Theo93/article/details/102304977

版权

这篇博客探讨了数据分析中的聚类方法，包括使用R语言实现的K-means算法及其优缺点，如对初始值的不敏感性和对非球形簇的处理能力不足。此外，还介绍了基于密度的DBSCAN方法，其核心思想是通过密度可达性来形成簇，但参数选择需要经验。最后，文章提到了孤立点检测的几种方法，如统计方法和基于聚类的检测。

摘要由CSDN通过智能技术生成

聚类，k-mean方法，基于密度的方法：DBSCAN，孤立点检测——数据分析与R语言 Lecture 10

聚类

在这里插入图片描述

dist( )函数

x1=c(1,2,3,4,5)
x2=c(3,2,1,4,6)
x3=c(5,3,5,6,2)
x=data.frame(x1,x2,x3)

在这里插入图片描述

各种类与类之间距离计算的方法

薛毅书P476
最短距离法
最长距离法
中间距离法
类平均法
重心法
离差平方和法

动态聚类：K-means方法

算法：
1 选择K个点作为初始质心
2 将每个点指派到最近的质心，形成K个簇（聚类）
3 重新计算每个簇的质心
4 重复2-3直至质心不发生变化

kmeans( )函数

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

CHEN_BR CSDN认证博客专家 CSDN认证企业博客

码龄5年

383: 原创

2万+: 周排名

34万+: 总排名

69万+: 访问

: 等级

8497: 积分

1493: 粉丝

224: 获赞

143: 评论

1423: 收藏

私信

关注

热门文章

分类专栏

FVCOM 97篇
adcirc 3篇
Python 57篇
爬虫
Qgis 5篇
Linux 92篇
Git 5篇
AI 10篇
Matlab 23篇
灾害
office 10篇
SMS 22篇
Tensorflow 3篇
Jupyter 4篇
Syder 1篇
Data analysis 15篇
GIS 67篇
R 15篇

最新评论

MIKE与SMS网格的区别
joyismine: 博主，区域假如稍微到半度×半度的话，岸线分辨率相同的情况下，SMS的生成的网格数量会比Mike多好几倍，因为SMS中间区域和靠近岸线的区域网格大小差距不大，而Mike就有差距。导致模拟时间也变长了，不知道有没有办法在除了调整岸线分辨率的情况下，在sms中将网格调整成岸线网格小中间大点，从而减少网格数。
开边界设置1：仅生成潮汐以及潮汐和平均流量的开放边界强迫
MR.阿伦: 请问博主，“对于边界处的表面高程”有详细教程吗？能否分享一下，谢谢！！！
错误
weixin_47159822: 请问这个问题应该怎么解决呢？
FVCOM工具
weixin_47159822: 跑之前输入ulimit -s unlimited
FVCOM工具
西伯利亚悍匪: 请问有没有什么在Linux子系统下跑fvcom的电脑型号的推荐呢？我跑的时候有指向电脑底层文件问题的报错，在挑选新电脑非常感谢！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。