一,引言
1,机器学习定义:一个程序被认为能够从经验E中学习从而解决任务T,达到性能度量值P,当且仅当有了E后经过P评判,程序在处理T时有所提升。
2,监督学习:给定数据集中每个样本的正确结果,拟合数据,推测出一个连续值得结果。
监督学习的两种问题:回归——推测出连续值
分类——推测出离散值
3,非监督学习:交给算法大量无标签的数据,并让算法为我们从数据中找出某种结构。
非监督学习的算法:聚类等
二、单变量线性回归
1,模型表示
一种可能的表达方式为:
只含有一个特征、输入变量,因此叫单变量线性回归问题。
2,代价函数
寻找合适参数(斜率和截距)。参数决定了建模误差(预测值与数据集中真实值的差距)。
用平方误差代价函数
选择出可以使建模误差平方和最小的模型参数。
平方误差函数是解决回归问题最常用的代价函数。
3,梯度下降
当越来越接近最小值,偏导将越来越小,学习幅度相应减小。
4,线性代数简述