自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

转载 Logistic Regression理论总结

简述:1. LR 本质上是对正例负例的对数几率做线性回归,因为对数几率叫做logit,做的操作是线性回归,所以该模型叫做Logistic Regression。2. LR 的输出可以看做是一种可能性,输出越大则为正例的可能性越大,但是这个概率不是正例的概率,是正例负例的对数几率。3. LR的label并不一定要是0和1,也可以是-1和1,或者其他,只是一个标识,标识负例和正例。4....

2018-08-31 21:51:29 478

转载 深度学习&分布式 中Parameter Server 详解

Parameter Server 详解本博客仅为作者记录笔记之用,不免有很多细节不对之处。还望各位看官能够见谅,欢迎批评指正。更多相关博客请猛戳:http://blog.csdn.net/cyh_24如需转载,请附上本文链接:http://blog.csdn.net/cyh_24/article/details/50545780MXNet 是李沐和陈天奇等各路英雄豪杰打造的...

2018-08-31 21:21:32 692

原创 [lintcode]142. O(1)时间检测2的幂次

链接:https://www.lintcode.com/problem/o1-check-power-of-2/description用 O(1) 时间检测整数 n 是否是 2 的幂次。O(1) 时间复杂度您在真实的面试中是否遇到过这个题?  是样例n=4,返回 true;n=5,返回 false.挑战O(1) time class Solution { ...

2018-08-29 15:47:09 206

原创 十道海量数据处理面试题与十个方法大总结

1. 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?方案1:可以估计每个文件安的大小为50G×64=320G,远远大于内存限制的4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。s 遍历文件a,对每个url求取,然后根据所取得的值将url分别存储到1000个小文件(记为)中。这样每个小文件的大约为300M。...

2018-08-28 17:14:35 133

原创 如何解决样本不均衡问题

解决样本不均衡的问题很多,主流的几个如下:1.样本的过采样和欠采样。2..使用多个分类器进行分类。3.将二分类问题转换成其他问题。4.改变正负类别样本在模型中的权重。  一、样本的过采样和欠采样。1.过采样:将稀有类别的样本进行复制,通过增加此稀有类样本的数量来平衡数据集。该方法适用于数据量较小的情况。2.欠抽样:从丰富类别的样本中随机选取和稀有类别相同数目的样...

2018-08-28 11:27:15 2475

原创 正则化方法:防止过拟合,提高泛化能力

正则化方法:防止过拟合,提高泛化能力在训练数据不够多时,或者overtraining时,常常会导致overfitting(过拟合)。其直观的表现如下图所示,随着训练过程的进行,模型复杂度增加,在training data上的error渐渐减小,但是在验证集上的error却反而渐渐增大——因为训练出来的网络过拟合了训练集,对训练集外的数据却不work。为了防止overfitting,可以...

2018-08-28 11:23:31 896

原创 快排

void quicksort(vector<int> &v,int left, int right){ if(left < right)//false则递归结束 { int key=v[left];//基数赋值 int low = left; int high = right; while(low ...

2018-08-27 20:45:52 533

转载 深度学习优化器 optimizer 的原理及选择

下面是 TensorFlow 中的优化器:详情参见:https://www.tensorflow.org/api_guides/python/train在 keras 中也有 SGD,RMSprop,Adagrad,Adadelta,Adam 等,详情:https://keras.io/optimizers/我们可以发现除了常见的梯度下降,还有 Adadelta,Adagrad...

2018-08-12 12:49:02 6226

原创 [leetcode]763. Partition Labels

链接:https://leetcode.com/problems/partition-labels/description/A stringSof lowercase letters is given. We want to partition this string into as many parts as possible so that each letter appears in...

2018-08-11 17:36:01 162 1

原创 如何等概率地从n个数中随机抽出m个数?

题 目:如何等概率地从n个数中随机抽出m个数?上题中如果n的大小不确定(可以认为是⼀个数据流),如何做? 方法:蓄水池抽样具体方法:我们先选取前m个数放入池中,然后我们每次以m/k的概率选择第k(k>m)个数a[k],然后再在蓄水池中随机选取一个元素a[j],交换a[k]和a[j]; Init : a reservoir with the size: m...

2018-08-11 15:54:37 5536

原创 [leetcode]47. Permutations II

链接:https://leetcode.com/problems/permutations-ii/description/ Given a collection of numbers that might contain duplicates, return all possible unique permutations.Example:Input: [1,1,2]Outpu...

2018-08-07 17:54:22 168

原创 [leetcode]46. Permutations

链接:https://leetcode.com/problems/permutations/description/Given a collection of distinct integers, return all possible permutations.Example:Input: [1,2,3]Output:[ [1,2,3], [1,3,2], [2,1...

2018-08-07 17:38:24 166

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除