工控协议数据处理（三）：Python聚类

最新推荐文章于 2024-08-11 01:45:50 发布

UnknownFlower

最新推荐文章于 2024-08-11 01:45:50 发布

阅读量314

点赞数

分类专栏： python 数据挖掘文章标签：聚类 python 网络协议

本文链接：https://blog.csdn.net/qq_39697843/article/details/111342909

版权

数据挖掘同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

python

3 篇文章 1 订阅

订阅专栏

网络协议有数百种，我们通过Kmeans方法针对协议层数和协议平均长度这两个属性进行聚类，可以发现在Y轴上区分度不大，大多数协议的层数都在8层以内，X轴上也没有明显的区分度，通过绘制聚类效果的折线图，可以确定在聚类为2层的时候效果最好。
在这里插入图片描述

import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
import sklearn.datasets as ds
import matplotlib
import pandas as pd
from sklearn.preprocessing import normalize
matplotlib.rcParams['font.sans-serif'] = [u'SimHei']
matplotlib.rcParams['axes.unicode_minus'] = False
dataz = pd.read_csv('./data_processed.csv')
data=dataz.loc[:,['ave_length','layers_count']].values.tolist()
print(data)
data = normalize(data, axis=0, norm='max')
#y=dataz.loc[:,['name']].values.tolist()

print(data)

#绘制样本点
colors=['red','yellow','blue','black','orange','pink']
plt.title(u"原始数据")
plt.subplot(211)
for dataxy in data:
    plt.scatter(dataxy[0],dataxy[1])
#开始聚类
model = KMeans(n_clusters=3,init="k-means++")
model.fit(data)
print(data)
result = model.labels_
print(result)
#对比分类效果
plt.title(u"聚类数据")
plt.subplot(212)
for i in range(0,len(data)):
    plt.scatter(data[i][0],data[i][1],color=colors[result[i]])
plt.show()

#假设我们不知道有几个簇，可以通过下面的方法来解决
a = []
for i in range(1,10):
    model = KMeans(n_clusters=i,init="k-means++")
    model.fit(data)
    a.append(model.inertia_)
a = np.array(a)
plt.plot(range(1,10),a/100)
plt.show()

本文采用 CC BY-NC-SA 4.0 许可协议，著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。
作者：smarthearts
来源：工控协议数据处理（三）：Python聚类 – it笔记
链接：http://www.oinote.com/193.html

UnknownFlower

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
工控协议数据处理（三）：Python聚类

网络协议有数百种，我们通过Kmeans方法针对协议层数和协议平均长度这两个属性进行聚类，可以发现在Y轴上区分度不大，大多数协议的层数都在8层以内，X轴上也没有明显的区分度，通过绘制聚类效果的折线图，可以确定在聚类为2层的时候效果最好。import numpy as npimport matplotlib.pyplot as pltfrom sklearn.cluster import KMeansimport sklearn.datasets as dsimport matplotlibim
复制链接

扫一扫

专栏目录