组会笔记

最新推荐文章于 2020-04-04 21:10:19 发布

1011667583

最新推荐文章于 2020-04-04 21:10:19 发布

阅读量178

点赞数 1

分类专栏：学术记录

本文链接：https://blog.csdn.net/qq_36752806/article/details/83387529

版权

学术记录专栏收录该内容

4 篇文章 0 订阅

订阅专栏

第一次《机器学习》组会

训练集、验证集、测试集的划分

training set、validation set、test set
一般对于这种validation set的设置是因为，要防止过拟合情况，模型用训练集数据训练好之后，通过验证集去看，模型是否过拟合，而一般这样做是因为我们在做以下几点：

筛选变量，或者测试正则惩罚项
神经网络训练的轮数，一般训练过多会过拟合，而训练过少会欠拟合（训练过多等价于梯度值变的越来越小，这也可以通过改变梯度的norm收敛判定值，来判断训练是否过拟合）

并且有时候还需要注意下面两点：

test set是绝对不能被污染的，不能通过test set的变化来转而改变模型的参数，test set只是用来测试模型好坏的集合。
对于交叉验证法，比如十折，将总体集合分为 training set 和test set，这其中test set也是绝对不能被污染的，如果要判定模型是否过拟合，可以通过将training set中分出一部分来作为validation set.

最后说一点，其实validation set并不一定是必须的，特别是在使用交叉验证法时，将data set分为training set和test set也不是算错，具体问题具体分析。

如何使用嵌套交叉验证方法处理时序数据
时间序列方法因为其前后相关性和时间依赖性，而不能随意打乱数据集顺序进行交叉验证，所以需要用到嵌套交叉验证方法。

某个分布的参数，服从另一个分布，该如何求取参数

还是利用极大似然法，在这里举个例子：
若 $X$ 服从 $N(0,\delta^2)$ 分布， $\delta$ 服从 $\Gamma(\alpha, \beta)$ 分布。 $X$ 的密度函数为 $\rho(x)$ ， $\delta$ 的密度函数为 $f(\delta,\beta,\alpha)$
$f(\delta,\beta,\alpha) = \frac{\beta}{\Gamma(\alpha)}\delta^{\alpha-1}e^{-\beta\delta},\text{~~~~~}\delta>0$
$L(\delta)=\rho(X_1)\rho(X_2)\cdots\rho(X_n)$

$L(\delta)$ 是样本 ${X_i\}$ 的联合密度函数，针对 $\delta$ 对此函数求取期望：

$E[L(\delta)]=\int_{-\infty}^{+\infty}L(\delta) f(\delta,\beta,\alpha)\, d\delta$

真正的参数是 $\alpha$ 和 $\beta$ ， $\delta$ 不是参数。

此时我们令 $h(\alpha,\beta)=E[L(\delta)]$ ，并 $max\text{~}h(\alpha,\beta)$ ，这样的话就可以求取参数 $\alpha$ 和 $\beta$ 的值了。这里对 $L(\delta)$ 的积分，我理解的是 $\delta$ 未知，对它求取期望就是对它的所有取值情况进行一个加权平均，从而消去参数 $\delta.$

1011667583

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
组会笔记

第一次《机器学习》组会训练集、验证集、测试集的划分training set、validation set、test set一般对于这种validation set的设置是因为，要防止过拟合情况，模型用训练集数据训练好之后，通过验证集去看，模型是否过拟合，而一般这样做是因为我们在做以下几点：筛选变量，或者测试正则惩罚项的时候神经网络训练的轮数，一般训练过多会过拟合，而训练过少会欠拟合（训...
复制链接

扫一扫