机器学习笔记
机器学习是最基础的,其中的核心部分是深度学习
机器学习的流程
1. 训练样本
2. 特征提取 特征工程是最重要的
3. 学习函数
4. 预测
算法
线性回归算法
- 线性回归是一个有监督算法
每个样本都有一个预值和真实值,他们之间存在误差,希望误差项越小越好
样本之间是独立的,互不影响;
因为要求的是cita,所以将误差转化为带cita的,将(1)求出误差表示式子后带入(2)
需要找一个cita,使得cita和x的组合成为真实值y的可能性越大越好,
累乘符号是因为样本之间独立同分布;为什么可以取对数:因为最后不是要求出来式子的值,只是要求一个cita值使得y最大。
化简式子,将log乘法,变成加法,log e~x 变成x,需要整体式子越大越好,前面部分是常数,减去后面,需要后面越小越好,就是求Jcita能够越小越好,求一个cita值(J这个式子又叫最小二乘法)
对目标函数求解,因为要求Jcita什么时候最小,所以对cita进行求偏导
遗留问题:一定满足求逆的条件吗?最后求得cita的表达式,得知X和Y可以直接求得cita,并没有学习的过程(学习过程应该是机器利用一个样本计算和Y作比较发现结果较差应该做出调整,将调整应用到下一个样本)