qq_34493390-CSDN博客

转载常见的防止过拟合的方法

正则化方法：防止过拟合，提高泛化能力在训练数据不够多时，或者overtraining时，常常会导致overfitting（过拟合）。其直观的表现如下图所示，随着训练过程的进行，模型复杂度增加，在training data上的error渐渐减小，但是在验证集上的error却反而渐渐增大——因为训练出来的网络过拟合了训练集，对训练集外的数据却不work。为了防止overfitt

2017-12-25 14:45:50 251

转载熵的知识

交叉熵（Cross-Entropy）交叉熵是一个在ML领域经常会被提到的名词。在这篇文章里将对这个概念进行详细的分析。 1.什么是信息量？假设X是一个离散型随机变量，其取值集合为X，概率分布函数为p(x)=Pr(X=x),x∈X，我们定义事件X=x0的信息量为： I(x0)=−log(p(x0))，可以理解为，一个事件发生的概率越大，则它所携带的信息量就越小，而当p(x0

2017-12-14 17:46:33 374

转载梯度下降法

在求解机器学习算法的模型参数，即无约束优化问题时，梯度下降（Gradient Descent）是最常采用的方法之一，另一种常用的方法是最小二乘法。这里就对梯度下降法做一个完整的总结。（loss最小化的调优方法） 1. 梯度　　　　在微积分里面，对多元函数的参数求∂偏导数，把求得的各个参数的偏导数以向量的形式写出来，就是梯度。比如函数f(x,y), 分别对x,y求偏导数，求得的梯度向量

2017-12-14 17:29:09 131

原创 ubuntu python版本切换

利用alternative机制，shell里输入 sudo update-alternatives --install /usr/bin/python python /usr/bin/python2 100 sudo update-alternatives --install /usr/bin/python python /usr/bin/python3 150 输入此命令 sudo

2017-03-27 17:59:08 178

原创 pyspark调用jupyter notebook

Spark2.x 1.vi pyspark 2.更改以下语句 export PYSPARK_DRIVER_PYTHON=jupyter export PYSPARK_DRIVER_PYTHON_OPTS='notebook' pyspark 3.输入pyspark验证成功

2017-03-25 20:36:29 647

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

转载 常见的防止过拟合的方法

转载 熵的知识

转载 梯度下降法

原创 ubuntu python版本切换

原创 pyspark调用jupyter notebook

空空如也

空空如也

转载常见的防止过拟合的方法

转载熵的知识

转载梯度下降法