自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 tensorflow InvalidArgumentError: Cannot serialize protocol buffer of type tensorflow.GraphDef 错误分析

训练nfm模型,每2000个step进行保存。一开始模型训练正常,但是在使用tf.train.Saver的save方法保存模型时出现了如下错误:tensorflow.python.framework.errors_impl.InvalidArgumentError: Cannot serialize protocol buffer of type tensorflow.GraphDef as the serialized size (2239053850bytes) would be larger th

2020-08-27 20:52:57 1791 2

原创 SVM(支持向量机)原理及数学推导

决策平面在样本空间中,超平面可以用以下线性方程描述:(1)wTx+b=0\tag{1}\bold{w^Tx} + b = 0wTx+b=0(1)其中w=[w1  w2  ...  wm]\bold w = [w_1 \ \ w_2 \ \ ... \ \ w_m]w=[w1​  w2​ &nbsp...

2019-08-06 22:37:20 256

原创 避免过拟合的方法

1. Weight Decay 权重衰减​ 等价于L2范数正则化。为模型损失函数添加惩罚项,新的损失函数为:L=l(w,b)+λ2∣∣w∣∣2w←w−η∂L∂wL = l(w,b) + \frac{\lambda}{2}||w||^2\\w \larr w - \eta \frac{\partial L}{\partial w}\\L=l(w,b)+2λ​∣∣w∣∣2w←w−η∂w∂L...

2019-07-19 21:17:07 338

原创 经典神经网络

LeNet(1998)可以看作是第一个卷积网络的实例。使用步长为1,大小为5x5的卷积核主要用于数字识别领域。AlexNet(2012)第一个在ImageNet的分类比赛中获得成功的大型卷积神经网络(第一个基于深度学习的网络架构)。从此卷积神经网络开始了大规模的研究和应用。基础架构是卷积层——池化层——归一化层——卷积层——池化层——全连接层。层数变多,卷积层达到了5层。VGG(20...

2019-07-19 21:12:18 349

原创 神经网络的优化算法

神经网络的优化算法1. SGD 随机梯度下降wt←wt−1−η∇wL(x)w_t \larr w_{t-1}-\eta\nabla_w L(x)wt​←wt−1​−η∇w​L(x)​ 训练速度较快,但是不是全局最优解,容易困在鞍点(saddle point)和极小值点。如果函数的形状非均向,搜索路径效率就会非常低(根本原因:梯度方向没有指向最小值方向)2. Momentum 动量​...

2019-05-28 09:13:22 394

原创 线性回归与逻辑回归的原理及推导

线性回归线性回归使用线性模型去拟合数据集,进行预测。线性回归的预测函数的一般形式为:f(x)=Σi=0nwixi+bf(\bold x) = \Sigma_{i=0}^n w_ix_i +bf(x)=Σi=0n​wi​xi​+b用xi\bold x_ixi​表示第i个样本的特征,如果样本有m个特征,则xi\bold x_ixi​为一个m为特征向量xi=[x1(i) x2(i)&...

2019-05-09 11:00:27 1239

原创 使用pyspark实现计算Top k

关于Spark和Hadoop的安装这里暂且不讲,只讲Spark的使用。Top K就是要计算一个数组中前k个最大元素。这里我们把数据存储在一个文件中,文件中的没一行对应的是数据的id和数据的值。其中的每个id可能会多次出现。需要计算所有id中对应的出现的值之和最大的k个id。文件格式:id1,200id2,700id3,450id1,300...首先使用spark需要导入py...

2019-03-22 10:50:18 3486 3

原创 三种决策树划分节点的选择依据

因为记不太清决策树划分节点时的特征选择依据是怎么算的,所以现在整理一下,顺便区分一下ID3、C4.5、CART分别使用的节点划分方法以及区别。决策树的建树方法都是使用贪心的方法,每次都选择当前节点的最优划分。ID3ID3使用最大信息熵增益(Information Gain)来选择分割数据的特征信息熵Entropy或Info。熵反应了物体内部的混乱程度,而信息熵反应了不同类的样本的占比,...

2019-03-20 21:04:59 14431 1

原创 牛顿法及其几何意义理解

牛顿法牛顿法是一种用来求解可微函数的近似解的方法。首先从几何意义上直观的理解一下牛顿法。图中y=f(x)y=f(x)y=f(x) 是一个可微函数。在点(xn,f(xn))(x_n, f(x_n))(xn​,f(xn​))作切线,和yyy轴的交点记为xn+1x_{n+1}xn+1​。Δx=xn+1−xn\Delta x = x_{n+1}-x_nΔx=xn+1​−xn​。要求方程f(x)=0f...

2019-01-07 15:24:07 8216 1

原创 使用IntelliJ IDEA构建Spring Boot + JSP项目

项目开发过程中需要用到Spring Boot + JSP,在搭建框架的时候也碰到了不少问题,所以在这里自己整理了一篇教程以及一些注意事项。 首先创建一个Spring Boot项目。为了方便,可以选择File——>New Project——>Spring Initializer,使用Spring Initializer从https://start.spring.io/创建Spri...

2018-07-25 19:43:49 2966 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除