1.基本概念
1.1根据输入和输出变量的不同类型,将预测任务分为:
回归问题:输入变量和输出变量均为连续变量
分类问题:输出变量为有限个离散变量
标注问题:输入变量和输出变量均为变量序列
1.2统计学习三要素
方法=模型+策略+算法
模型——所要学习的条件概率,或决策函数
策略——按照什么样的准则学习或选择最优的模型
损失函数——度量模型一次预测的好坏;常用的损失函数有:0-1损失函数,平方损失函数,绝对损失函数,对数损失函数
算法——学习模型的具体计算方法
2.感知机——二分类线性分类模型,判别模型
输入为实例的特征向量,输出为实例的类别取值为+1,-1,
感知机学习旨在求出将训练数据进行线性划分的分离超平面
感知机的学习算法——梯度下降算法
感知机学习算法的对偶形式
from sklearn.linear_model import Perceptron
clf = Perceptron(fit_intercept=False, max_iter=1000, shuffle=False)
clf.fit(X, y)
print(clf.coef_)