组会笔记

第一次《机器学习》组会

训练集、验证集、测试集的划分

training set、validation set、test set
一般对于这种validation set的设置是因为,要防止过拟合情况,模型用训练集数据训练好之后,通过验证集去看,模型是否过拟合,而一般这样做是因为我们在做以下几点:

  1. 筛选变量,或者测试正则惩罚项
  2. 神经网络训练的轮数,一般训练过多会过拟合,而训练过少会欠拟合(训练过多等价于梯度值变的越来越小,这也可以通过改变梯度的norm收敛判定值,来判断训练是否过拟合)

并且有时候还需要注意下面两点:

  • test set是绝对不能被污染的,不能通过test set的变化来转而改变模型的参数,test set只是用来测试模型好坏的集合。
  • 对于交叉验证法,比如十折,将总体集合分为 training set 和test set,这其中test set也是绝对不能被污染的,如果要判定模型是否过拟合,可以通过将training set中分出一部分来作为validation set.

最后说一点,其实validation set并不一定是必须的,特别是在使用交叉验证法时,将data set分为training set和test set也不是算错,具体问题具体分析。

如何使用嵌套交叉验证方法处理时序数据
时间序列方法因为其前后相关性和时间依赖性,而不能随意打乱数据集顺序进行交叉验证,所以需要用到嵌套交叉验证方法。

某个分布的参数,服从另一个分布,该如何求取参数

还是利用极大似然法,在这里举个例子:
X X X服从 N ( 0 , δ 2 ) N(0,\delta^2) N(0,δ2)分布, δ \delta δ服从 Γ ( α , β ) \Gamma(\alpha, \beta) Γ(α,β)分布。 X X X的密度函数为 ρ ( x ) \rho(x) ρ(x) δ \delta δ的密度函数为 f ( δ , β , α ) f(\delta,\beta,\alpha) f(δ,β,α)
f ( δ , β , α ) = β Γ ( α ) δ α − 1 e − β δ ,       δ > 0 f(\delta,\beta,\alpha) = \frac{\beta}{\Gamma(\alpha)}\delta^{\alpha-1}e^{-\beta\delta},\text{~~~~~}\delta>0 f(δ,β,α)=Γ(α)βδα1eβδ,     δ>0
L ( δ ) = ρ ( X 1 ) ρ ( X 2 ) ⋯ ρ ( X n ) L(\delta)=\rho(X_1)\rho(X_2)\cdots\rho(X_n) L(δ)=ρ(X1)ρ(X2)ρ(Xn)

L ( δ ) L(\delta) L(δ)是样本 { X i } \{X_i\} {Xi}的联合密度函数,针对 δ \delta δ对此函数求取期望:

E [ L ( δ ) ] = ∫ − ∞ + ∞ L ( δ ) f ( δ , β , α )   d δ E[L(\delta)]=\int_{-\infty}^{+\infty}L(\delta) f(\delta,\beta,\alpha)\, d\delta E[L(δ)]=+L(δ)f(δ,β,α)dδ

真正的参数是 α \alpha α β \beta β δ \delta δ不是参数。

此时我们令 h ( α , β ) = E [ L ( δ ) ] h(\alpha,\beta)=E[L(\delta)] h(α,β)=E[L(δ)],并 m a x   h ( α , β ) max\text{~}h(\alpha,\beta) max h(α,β),这样的话就可以求取参数 α \alpha α β \beta β的值了。这里对 L ( δ ) L(\delta) L(δ)的积分,我理解的是 δ \delta δ未知,对它求取期望就是对它的所有取值情况进行一个加权平均,从而消去参数 δ . \delta. δ.

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。
经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 经导师精心指导并认可、获 98 分的毕业设计项目!【项目资源】:微信小程序。【项目说明】:聚焦计算机相关专业毕设及实战操练,可作课程设计与期末大作业,含全部源码,能直用于毕设,经严格调试,运行有保障!【项目服务】:有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值