![94414f0802e5f7bbda72384ed5a6030e.png](https://i-blog.csdnimg.cn/blog_migrate/07f893ac736260380e67fb6edbcaae51.jpeg)
一、什么是机器学习
利用大量的数据样本,使得计算机通过不断的学习获得一个模型,用来对新的未知数据做预测。
- 有监督学习(分类、回归)
同时将数据样本和标签输入给模型,模型学习到数据和标签的映射关系,从而对新数据进行预测。
![7ca05bbd1aa2f4dca3d867d7cf3d60e2.png](https://i-blog.csdnimg.cn/blog_migrate/6204d539408edcd88423d35388f2fb98.jpeg)
- 多变量情况:
二维空间的直线,转化为高维空间的平面
![a7e820b001633d39f8db02e84b29e96d.png](https://i-blog.csdnimg.cn/blog_migrate/1d237d2f7a4cbba9bfb43781be1d158b.png)
2.1 线性回归的表达式
机器学习是数据驱动的算法,数据驱动=数据+模型,模型就是输入到输出的映射关系。
模型=假设函数(不同的学习方式)+优化
1. 假设函数
![762d3fbccc42dcbf62db3368cba489cb.png](https://i-blog.csdnimg.cn/blog_migrate/1c0f9e38797b585e741c78fcc7c6d5e8.png)
2. 优化方法
监督学习的优化方法=损失函数+对损失函数的优化
![802f6999410cc0de462485aca4a4d408.png](https://i-blog.csdnimg.cn/blog_migrate/57b9479cd2a486613b398e7913efba57.jpeg)
4. 损失函数的优化
损失函数如右图所示,是一个凸函数,我们的目标是达到最低点,也就是使得损失函数最小。
![2590ab47640628b08bb486021415b1a9.png](https://i-blog.csdnimg.cn/blog_migrate/3b3f19390af44758fd234dd5e4bef06c.png)
多元情况