1.接口
首先我们就要知道sklearn里面有哪些接口可以使用,主要分为分类、回归、聚类、降维四类
我用sklearn应该主要还是聚类(降维也可能用到),放大来看有如下这些:
2.dataset
sklearn的dataset里面内置了很多可用的数据,可以load一些已有的data,也可以generate一些你想要的data
3.数据标准化normalization(在sklearn里面也叫scale)
from sklearn import preprocessing
preprocessing.scale(a) #将数据转换为类似的量级
preprocessing.minmax_scale(a,feature_range=(a,b)) #人为设置标准化范围