Python(Cluster)

最新推荐文章于 2024-05-22 16:59:54 发布

codeQin

最新推荐文章于 2024-05-22 16:59:54 发布

阅读量3.7k

点赞数 1

分类专栏： sklearn 文章标签： machine learning cluster

本文链接：https://blog.csdn.net/qq_42394743/article/details/82936468

版权

这篇博客介绍了Python中几种常用的聚类算法，包括KMeans、MeanShift、AgglomerativeClustering和DBSCAN。通过加载数据，进行预处理，然后应用这些算法并评估聚类效果，展示了如何使用sklearn库进行聚类分析。

摘要由CSDN通过智能技术生成

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import preprocessing
from sklearn.cluster import KMeans
from sklearn.cluster import MeanShift,estimate_bandwidth
from sklearn.cluster import AgglomerativeClustering
from sklearn.cluster import DBSCAN
from sklearn import metrics

import warnings
warnings.filterwarnings('ignore')

'''
data From:http://archive.ics.uci.edu/ml/datasets/Dishonest+Internet+users+Dataset
'''
#读取数据
dataset = []
with open('clustering.txt','r') as f:
for line in f.readlines():
attrs = line[0:-1].split(' ')
dataset.append(attrs)
dataset = np.array(dataset)
#预处理
for index,value in enumerate(dataset[0]):
if value.isdigit():
dataset[:,in