分类算法
目标值:类别
sklearn转换器与预估器
KNN算法
模型选择与调优
朴素贝叶斯算法
决策树
随机森林
转换器
特征工程的父类 继承Transformer
回想一下之前的特征工程的步骤
1.实例化(实例化一个转换器类(Transformer))
2.调用fit_transform(对于文档建立分词频矩阵,不能同时调用)
我们把特征工程的接口称之为转换器,其中转换器调用有这么几种形式
fit_transform
fit
transform
以标准化为例
用 进行转换的特征减去平均值 除以标准差
fit 计算每一列的平均值和标准差
transform (x-mean)/std 进行最终的转换
估计器
这些算法都是estimator的子类,都有通用的方法
实例化一个estimator
使用estimator的方法
estimator.fit(x_train, y _train) 计算
机器学习归根结底是再做运算
调用完毕 模型生成
评估模型好不好
模型评估
1)直接比对预测值和真实值
y_predcit = estimator.predict(x_test)
y_test = y_predict
2)计算准确率,用的是estimator的score方法