自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

数据之美的博客

玩机器学习的总要会玩数据才行

  • 博客(12)
  • 收藏
  • 关注

原创 YouTube视频推荐中的召回模型和排序模型-Deep Neural Networks for YouTube Recommendations

文章目录1.YouTube论文概述2.召回模型3.排序模型特征表达特征工程离散特征embedding化连续特征归一化建模观看时间Hidden layers的实验参考资料1.YouTube论文概述YouTube在16年发的这篇经典paper,是同时解决了推荐系统的中召回问题和排序问题,因此也有两个两个网络模型:1.召回模型:从上百万的视频库中选出数百个与用户最相关的视频;2.排序模型:从上...

2019-11-14 00:17:57 4392 4

原创 leetcode-给定二叉搜索树和一个目标值,判断树中是否有两元素加和等于目标值 思路与代码

问题描述问题链接:https://leetcode.com/problems/two-sum-iv-input-is-a-bst/给定一个二叉搜索树和一个目标值,如果在树中存在两个元素加和等于目标值则返回true,否则放那会false。Given a Binary Search Tree and a target number, return true if there exist two...

2019-11-30 22:22:34 976

原创 leetcode-满足连续子数组加和等于目标值的子数组个数 思路与代码

文章目录问题描述问题分析问题解法问题描述问题链接:https://leetcode.com/problems/subarray-sum-equals-k/给定一个数组,请找到有多少个连续子数组加和等于给定目标数值?问题分析首先想到的是两件事情:两层for循环遍历的解法;两层for循环遍历大概率会出现TLE的错误,哈哈,不是废话嘛因此,我们需要将O(n^2)的解法从时间上优化...

2019-11-30 21:37:34 4227

原创 spark scala环境配置与新建scala工程

文章目录1. scala安装方式2. scala安装3. 新建scala工程4. scala code1. scala安装方式https://www.scala-lang.org/download/可以看到两种安装scala方式:方式1:通过intellij 的IDEA安装方式2:通过sbt安装以使用IDEA maven安装为例,即上图中左侧的安装方式,点击红框中的Getting...

2019-11-28 20:58:04 553

原创 FM-Factorization Machines

文章目录1.介绍2.FM模型函数及应用2.1 FM模型2.1.1 FM模型&模型的表达能力2.1.2 稀疏数据下的参数估计2.1.3 二阶交叉特征部分的计算2.2 FM的应用2.3 FM参数的更新学习2.4 总结参考资料1.介绍FM-Factorization Machine是一种结合了因式分解模型和SVM模型的优势的新的模型。FM相比于SVM有如下特点:两者都是需要实值特征向量...

2019-11-24 17:12:02 893

原创 史上最详细的梯度下降优化算法介绍(从SGD到Adam至Lookahead)

文章目录1.介绍2.常见优化算法2.1 梯度下降法及其变种2.1.1 批梯度下降法2.1.2 随机梯度下降法2.1.3 小批量梯度下降法2.1.4 梯度下降法的缺点2.2 梯度下降法的优化算法2.2.1 Momentum-动量法2.2.2 Nesterov-加速梯度下降法2.2.3 Adagrad-自适应梯度2.2.4 Adadelta2.2.5 RMSprop2.2.6 Adam-自适应矩估计2...

2019-11-21 01:22:04 18334 1

转载 tensorflow-tf.slice和tf.gather切片函数

tf.slice(input_, begin, size, name=None):按照指定的下标范围抽取连续区域的子集 tf.gather(params, indices, validate_indices=None, name=None):按照指定的下标集合从axis=0中抽取子集,适合抽取不连续区域的子集输出:input = [[[1, 1, 1], [2, 2, 2...

2019-11-19 00:45:53 1348

原创 L2正则化解决模型过拟合问题

什么是L2正则化L2正则化也有防止模型过拟合的能力,但是相比于L1正则化(想再学习下L1正则化原理,请参考 L1正则化解决模型过拟合问题),两者防止过拟合的方式大有区别,首先看下加入L2正则化的模型损失函数:JL2(w)=L(w)+λ2nw2J_{L2}(w) = L(w) + \frac{\lambda}{2n}w^2JL2​(w)=L(w)+2nλ​w2对于原始损失函数求一阶导为:...

2019-11-16 20:03:43 1201

原创 L1正则化解决模型过拟合问题

什么是L1正则化在机器学习任务中,对于一个参数模型,优化参数时一定伴随着损失函数的建立与优化。通常不加入L1正则化的损失函数为JL1(w)=L(w)J_{L1}(w) = L(w)JL1​(w)=L(w)加入L1正则化的损失函数为JL1(w)=L(w)+λ∣w∣J_{L1}(w) = L(w) + \lambda|w|JL1​(w)=L(w)+λ∣w∣所以L1正则化就是在原来损...

2019-11-16 18:58:41 1104

原创 判断二叉树是否是二叉排序树 思路与代码

问题:给定一棵二叉树的根节点 root,请判断其是否是二叉树排序树?二叉排序树的基本概念:如果二叉树根节点的左子树不为空 ,那么左子树的所有节点数值均不大于根节点数值;如果二叉树根节点的右子树不为空 ,那么右子树的所有节点数值均不小于根节点数值;根节点的左子树、右子树也均为二叉排序树。此处需要用到树的遍历,二叉树常用的遍历操作为前序遍历、中序遍历、后续遍历、层序遍历等遍历方式,...

2019-11-16 17:12:03 2865

原创 SQL统计字段值的累加和

假设hive表 data.table 字段结构如下:CREATE TABLE IF NOT EXISTS `$target.table`( id string COMMENT '用户ID', pv_cnt bigint COMMENT '浏览次数') COMMENT ''PARTITIONED BY (dt string COMMENT '日期') STORED AS ORC;...

2019-11-14 02:37:01 13439

原创 linux crontab调度python文件报错:ModuleNotFoundError: No module named 'pandas'

环境:centOS7,anaconda3预测python脚本写好以后,准备用脚本部署调度。但是python文件 在linux本地直接python XX.py可以直接运行,放在crontab中调度一直没有成功。首先要确定crontab中调度的时候回,无论是脚本还是python,所有的路径注意写绝对路径。否则crontab默认的路径下会找不到文件。python脚本执行的问题主要是解释器的...

2019-11-11 16:29:19 2886 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除