学生月上网时间分布聚类

m0_71341671

于 2022-05-25 09:31:23 发布

阅读量212

点赞数

文章标签：聚类 python 数据挖掘

本文链接：https://blog.csdn.net/m0_71341671/article/details/124959825

版权

# 聚类：DBSCAN算法实现（无需人为指定分成几类）#1.建立工程，导入sklearn相关包import numpy as npimport sklearn.cluster as skcfrom sklearn import metrics # 用于评价指标import matplotlib.pyplot as plt#2.读取数据并进行处理mac2id=dict()onlinetimes=[]f=open('TestData.txt',encoding='utf-8')for li

摘要由CSDN通过智能技术生成

# 聚类：DBSCAN算法实现（无需人为指定分成几类）
#1.建立工程，导入sklearn相关包
import numpy as np
import sklearn.cluster as skc
from sklearn import metrics # 用于评价指标
import matplotlib.pyplot as plt

#2.读取数据并进行处理
mac2id=dict()
onlinetimes=[]
f=open('TestData.txt',encoding='utf-8')
for line in f:
mac=line.split(',')[2]
onlinetime=int(line.split(',')[6])
starttime=int(line.split(',')[4].split(' ')[1].split(':')[0])
if mac not in mac2id:
mac2id[mac]=len(onlinetimes)
onlinetimes.append((starttime,onlinetime))
else:
onlinetimes[mac2id[mac]]=[(starttime,onlinetime)]
real_X=np.array(onlinetimes).reshape((-1,2)) # n行2列
'''
mat (or array).reshape(c, -1) 必须是矩阵格式或者数组格式，才能使用 .reshape(c, -1) 函数，表示将此矩阵或者数组重组

最低0.47元/天解锁文章

m0_71341671

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
学生月上网时间分布聚类

# 聚类：DBSCAN算法实现（无需人为指定分成几类）#1.建立工程，导入sklearn相关包import numpy as npimport sklearn.cluster as skcfrom sklearn import metrics # 用于评价指标import matplotlib.pyplot as plt#2.读取数据并进行处理mac2id=dict()onlinetimes=[]f=open('TestData.txt',encoding='utf-8')for li
复制链接

扫一扫