面试问
机器学习
为了解决任务t,设计一个程序,达到性能度量P,当且仅当有了e,在经过p评判后,程序处理任务t时性能得到提升
例1 扑克牌的联合分布(离散)
判别方法直接学习条件概率
后验,似然,先验,证据
beta分布
概率的概率分布
学生派,频率学派,贝叶斯派,垫子派,
贝叶斯派应用性最好
超级重要
1.模型,:
假设空间:h(θ)*f(X) 例如:回归方程参数 h(θ)=θ1+θ2x
2.策略
3.算法
策略中的损失函数:
举例方法:梯度下降法
算法是:优化算法去求风险函数的最小值
代价函数,误差函数,损失函数 误差解释:J(西塔0,西塔1)
面试问题: 线性回归用的什么损失
线性回归用的平方损失
每个点的误差加起来,然后*1/(2m) (二维)
随机取某点做切线,取方向,这是一个向量,
目的,想让J(西塔0,西塔1) 达到最小值,即损失最小,
梯度下降法
α是学习率,相当于步长,让学习步长小范围下降,直到找到最θ1小值
这样损失函数就到了最小值!!
代码:复现一元函数梯度下降 损失
B 和 c(n,k)共轭证明!!
02 梯度下降怎么用
随机梯度下降法
01 批量
02 随机(1条)
03 小批量(方向随机,sgd)
代码
. 当前目录
liner_
fig_id 文件名
01创建测试集