李宏毅机器学习任务五

一. 推导LR损失函数

1.通过对数似然函数来取得参数 w w w

二分类,标签设置为 y1=1,y0=0,有m个样本。

L ( w ) = ∏ i m f w ( x 1 ) ⋅ f w ( x 2 ) ⋅ ( 1 − f w ( x 3 ) ) . . . f w ( x m ) L(w)=\prod_{i}^{m}f_w(x_1)\cdot f_w(x_2)\cdot(1-f_w(x_3))...f_w(x_m) L(w)=imfw(x1)fw(x2)(1fw(x3))...fw(xm)

w ∗ = a r g m a x w L ( w ) w^*=argmax_{w}L(w) w=argmaxwL(w)

经过取对数取反得到

− l n L ( w ) = − ∑ i m y i l n ( f ( w i ) ) + ( 1 − y i ) l n ( 1 − f ( w i ) ) -lnL(w)=-\sum _{i}^{m}y_iln(f(w_i))+(1-y_i)ln(1-f(w_i)) lnL(w)=imyiln(f(wi))+(1yi)ln(1f(wi))

2.交叉熵得到LR损失函数

在这里插入图片描述

二. LR梯度下降

在这里插入图片描述

Softmax原理

个人理解是,计算出样本属于不同类别的概率,然后进行归一化,选出概率最大的为分类类别
具体的原理待补。

Softmax损失函数和梯度下降推导

在这里插入图片描述

主要内容:本文详细介绍了一种QRBiLSTM(分位数回归双向长短期记忆网络)的时间序列区间预测方法。首先介绍了项目背景以及模型的优势,比如能够有效利用双向的信息,并对未来的趋势上限和下限做出估计。接着从数据生成出发讲述了具体的代码操作过程:数据预处理,搭建模型,进行训练,并最终可视化预测结果与计算分位数回归的边界线。提供的示例代码可以完全运行并且包含了数据生成环节,便于新手快速上手,深入学习。此外还指出了模型未来发展的方向,例如加入额外的输入特性和改善超参数配置等途径提高模型的表现。文中强调了时间序列的标准化和平稳检验,在样本划分阶段需要按时间序列顺序进行划分,并在训练阶段采取合适的手段预防过度拟合发生。 适合人群:对于希望学习和应用双向长短时记忆网络解决时序数据预测的初学者和具有一定基础的研究人员。尤其适用于有金融数据分析需求、需要做多一步或多步预测任务的从业者。 使用场景及目标:应用于金融市场波动预报、天气状况变化预测或是物流管理等多个领域内的决策支持。主要目的在于不仅能够提供精确的数值预计还能描绘出相应的区间概率图以增强结论置信程度。 补充说明:本教程通过一个由正弦信号加白噪构造而成的简单实例来指导大家理解和执行QRBiLSTM流程的所有关键步骤,这既方便于初学者跟踪学习,又有利于专业人士作为现有系统的补充参考工具。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值