轮廓系数
直觉理解:大概就是衡量是否相同类别的样本都能聚在一起(也就是把聚类的结果可视化,能否很明显地看到相同颜色的类别有一个很明显的聚集)
弊端:有时候轮廓系数高,可能有聚类太细的风险(比如苹果、梨这类水果聚在一起时的轮廓系数不如单独把苹果聚一类、梨聚一类的轮廓系数高,而后者通常是我们不那么想看到的)
python中将unicode转化为float
读取python2
生成的.npy
文件时,常常读出unicode
,处理方式:
v= float(cur.encode("utf-8"))
python读取.csv文件跳过第一行
参考文章Python csv 跳过第一行
import csv
from itertools import islice
with open('表格/2019-04-01.csv', 'r') as read_file:
reader = csv.reader(read_file)
for row in islice(reader, 1, None):
print(row)
我说为啥以前读.csv
的时候,读后存成的.npy
或.json
常常多一个”id“