- 博客(9)
- 资源 (1)
- 收藏
- 关注
原创 生成式对抗网络 GAN
看了几篇博文,简单记录一下GAN网络(generative adversarial nets 生成式对抗网络)定义GAN网络起源于博弈理论,博弈的双方分别是生成式模型(G)和判别式模型(D)生成式模型的输入是一组服从某一分布的噪声,生成一个类似真实训练数据的样本;判别式模型的输入就是生成式模型的输出,判别式模型的目的是判断这个生成的样本是不是来自于训练数据(概率);有点类似于G...
2018-12-23 22:04:47 388
原创 Top K问题
在大量数据(海量)中找到前K大或者前K小的数一般而言有两种思路:利用堆排序和利用快排,其中快排的效率会更高效一些 利用堆排序:堆排序的基本思路就是建立最大堆(最小堆),最大堆是父节点比任意子节点的值都要大,根节点是最大的值。堆排序的话就将全部的n个数组成最大堆,那么根节点就是最大的数,保留这个根节点;然后将最后一个叶子节点换到根节点上,调整整个堆使之重新成为最大堆,那么根节点就是第...
2018-12-22 20:17:11 186
原创 1000个苹果分成10份,使得可以拼出1-1000的任何数
就是说1000个苹果,分成10个袋子,每个袋子装若干苹果。当有人来买苹果时,不管要的是1-1000个苹果里的多少个苹果,都可以整袋整袋凑出整好的苹果树 答:1 2 4 8 16 32 64 128 256 512 (当然最后不够512个)实际上分成2的k次幂试一试前几个应该就能找到规律了 另外在多重背包里也用到过这个思想,将多重背包分成这样的数量,就可以进行任何的组合了...
2018-12-17 11:45:34 1977
原创 二叉树的递归非递归遍历
二叉树定义结构:struct BtNode{ int data; BtNode * lchild; BtNode * rchild;};二叉树有三种遍历,前序遍历,中序遍历,后序遍历前序遍历的顺序是对每一棵树(子树),先访问根节点,然后访问左子树,然后访问右子树中序遍历的顺序是对每一棵树,先访问左子树,再访问根节点,再访问右子树;后序遍历的顺序是对每一棵树,先访问左子...
2018-12-17 11:39:17 205
原创 LSTM & GRU
basic RNN:LSTM long-term short-term memory LSTM的提出主要是为了解决传统RNN在长序列时会发生的梯度消失或者梯度爆炸的问题,在LSTM中,状态的更新是累加的方式,而不是累乘主要有三个门:forget input和output,来调节应该记住多少,忘掉多少,到下一步输出多少最上方的贯穿整个的横线表示细胞状态(核心),输入时是c...
2018-12-16 21:46:19 176
原创 RNN 梯度消失和梯度爆炸
为什么会梯度爆炸或梯度消失:梯度爆炸指的是在训练时,累计了很大的误差导数,导致神经网络模型大幅更新。这样模型会变得很不稳定,不能从训练数据中很好的进行学习。极端情况下会得到nan.会发生这个的原因是在神经网络层间不断的以指数级在乘以导数。补充:雅克比矩阵 -- 函数的一阶偏导数以一定方式排列成的矩阵,举个例子:可以看到,除对角线元素外,其他元素都是0.而对角线上的元素值就是对应的y...
2018-12-16 16:08:35 2115
原创 机器学习中的正则化(Regularization)
参考知乎回答:https://www.zhihu.com/question/20924039以及博客https://blog.csdn.net/jinping_shi/article/details/52433975定义&用途经常能在LOSS函数的后面看到额外加了一项,这一项就是用来正则化的,为了限制损失函数中一些参数正则化是用来干什么的呢?--是用来防止过拟合的...
2018-12-15 15:04:15 1087
原创 快速排序相关——基本快排实现,优化,第K大数
快速排序//部分参考维基百科https://zh.wikipedia.org/wiki/目录快速排序基本介绍整体的思路代码实现第K大数字:最坏情况优化:与堆排序、归并排序的比较基本介绍在平均状况下,排序个项目要次比较。在最坏状况下则需要次比较,但这种状况并不常见。事实上,快速排序通常明显比其他算法更快,因为它的内部循环(inner loop)可以在大...
2018-12-13 23:56:20 608
原创 【论文阅读】:Embedding-based News Recommendation for Millions of Users
非常实用性的一个推荐新闻的模型摘要:新闻推荐非常重要,但是传统的基于用户id的协同过滤和低秩分解推荐算法不完全适用于新闻推荐,因为新闻类文章过期的太快了基于单词的方法性能不错,但是有处理同义词和定义用户需求的问题因此本文提出一种基于嵌入式的算法,基于一种去噪自编码器的变体的方法来表示文章;用RNN以浏览历史为输入序列表示用户;用内积计算来匹配用户和文章 1 introduc...
2018-12-04 13:21:39 1073
微信小程序 在线电子书商城+阅读
2018-03-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人