机器学习与本课程示例概述
机器学习的角度看数学
数学分析
导数与梯度
Taylor展式的应用
概率论基础
古典概率
频率学派与贝叶斯学派
常见概率分布
Sigmoid/Logistic函数的引入
假如有房价数据:
这个函数越低越好。给定某一种学习方式,按照不断地迭代,到达最低点,这样有点,损失函数最小,认为是最优参数,需要解决的几个问题:
1.模型是如何建立的(线性模型还是非线性模型)
2.目标函数是如何得到的
3.在迭代过程中,如何能让模型越来越好的学下去(梯度下降,牛顿法。。)
4.有些超参数,需要调参,如何调参
可能有些模型中没有预测值,我们把参数带进去就可以算出预测值
SVM:高斯核函数的影响
HMM分词
LDA
例如一个石油检测结果处理
能得到最突出的问题
对函数的上升速度
当x= 1的时候,一定经过(0,1),当a等于几,切线斜率为1呢
简单来说,导数就是曲线的斜率,是曲线变化快慢的反应
二姐导数是斜率变化快慢的反应,表征曲线的凹凸性,二姐导数连续的曲线,称之为光顺的(加速度的方向总是指向轨迹曲线凹的一侧)
Taylor公式- Maclaurin公式
方向导数:
梯度:
梯度下降:
y = x**2
梯度是如何下降的?
假设上图,从x=3处开始迭代,沿着y的倒数:2x,也就是23=6。假定学习率是0.1,那么就是3-60.1=2.4,跑到了2.4这个位置,这样不断下降
如果有一个幂函数xn,一个指数函数e-x现在让他们从0到正无穷进行积分
凸函数