初识机器学习 | 8.聚类算法

最新推荐文章于 2024-05-03 09:51:05 发布

小哲嗨数

最新推荐文章于 2024-05-03 09:51:05 发布

阅读量103

点赞数

分类专栏：【机器学习】文章标签：机器学习 kmeans算法 python 数据挖掘

本文链接：https://blog.csdn.net/ganzheyu/article/details/103758757

版权

【机器学习】专栏收录该内容

10 篇文章 1 订阅

订阅专栏

import pandas as pd
import numpy as np
import matplotlib
import matplotlib.pyplot as plt
from sklearn import datasets

%matplotlib
%matplotlib inline
%config InlineBackend.figure_format = 'retina'

Using matplotlib backend: MacOSX

# 加载数据
df = pd.read_csv('https://query.data.world/s/ei6k5toqscwnarxr2ttfavrx2zodxc')
df.head(5)

	number	density	sugercontent
0	1	0.697	0.460
1	2	0.774	0.376
2	3	0.634	0.264
3	4	0.608	0.318
4	5	0.556	0.215

df.plot.scatter(x='density', y='sugercontent')

<matplotlib.axes._subplots.AxesSubplot at 0x11a539780>

png

K-Means算法

对于给定样本集，按照样本之间的距离大小，将样本集划分为K个簇，让簇内的点尽量紧密的连在一起，而让簇间的距离尽量大。

$E=\sum_{i=1}^{k} \sum_{\boldsymbol{x} \in C_{i}}\left\|\boldsymbol{x}-\boldsymbol{\mu}_{i}\right\|_{2}^{2}$

优惠劵

小哲嗨数

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
初识机器学习 | 8.聚类算法

import pandas as pdimport numpy as npimport matplotlibimport matplotlib.pyplot as pltfrom sklearn import datasets%matplotlib%matplotlib inline%config InlineBackend.figure_format = 'retina'U...
复制链接

扫一扫