自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

翻译 优化算法——牛顿法与拟牛顿法(DFP / BFGS)

工作中遇到优化的问题,回顾一下当初学过的基本优化算法。本博客主要考虑无约束且非线性的极小化优化问题: 在工作中遇到的变量和函数值均为1维变量,方便理解和处理。一、牛顿法直接贴合工作目标,考虑变量的维度为的情形。牛顿法的算法思想:给定一个随机初始点,在该点附近对目标函数作二阶泰勒展开,找到下一个迭代点,重复上述方式直至找到极值点。设...

2019-03-27 15:52:06 3281

原创 学习笔记3——LFM算法(Latent Factor Model)

1. LFM算法基本内容输入:user对item的点击矩阵参数:每一个user的向量表示和每一个item的向量表示方式:用user矩阵和item矩阵的矩阵乘 拟合 user对item的点击矩阵2. LFM应用普适场景:2.1 获取user的item推荐列表、2.2获取item间的相似度列表、2.3 挖掘item间隐含topic3. 实例:3.1 输入:user...

2019-03-24 11:59:00 2165 3

原创 学习笔记2——个性化召回算法综述

1. 个性化召回召回:从item set中选取一部分作为候选集(不同用户喜欢不同的item、item量级大则会导致排序慢,后端响应时间久)根据用户的属性行为、上下文等信息从item set中选取其感兴趣的item集合作为候选集;2. 召回决定了最终推荐结果的天花板(召回 -> 排序 -> 策略调整);3. 个性化召回解析3.1 基于用户行为:根据用户是否点击系统推荐...

2019-03-24 11:38:00 396

原创 学习笔记1——个性化推荐算法综述

1. 当物品数量远超人可以手动遍历的范围时,称为信息过载;2. 如果没有明确需求的用户访问了服务,且该服务的物品对于用户而言构成了信息过载,该系统基于一定规则策略(个性化推荐算法)将物品进行排序,并将排在前面的物品推荐给用户,这就是推荐系统;3. 个性化推荐算法在工业界成功落地的3类产品:3.1 地图(餐馆、影院多);3.2 电商(商品多);3.3 信息流(新闻、短视频多)。...

2019-03-24 10:32:37 604 1

原创 Hive SQL——技能 - 解析json列表,直至字段维度

小白问题描述:通过类似word2vec等方法,利用商品的历史订单,我们可以获取一些商品之间的关联关系。通常这些关联关系是以json串的形式存储在Hive表中,且一个关联关系下包含多个商品,通常的格式为:商品 关联商品列表 1001 [{"product_id":"1002","confidence":0.86},{"product_id":"1003","confidenc...

2019-02-26 19:01:49 2175

原创 Hive SQL——优化 - 减少查询job 加速得到查询结果

小白问题描述:图书馆图书按照类目进行区分,且由于图书的量级过大,一般仅一级类目无法满足快速定位到图书的需求,因此人们往往把图书划分为多级类目,例如一级类目cate1和二级类目cate2。我想同时统计一级类目cate1下书的个数和二级类目cate2下书的个数,怎么解决?图书表存储数据 book_id book_name cate1 cate2 1 ...

2019-01-16 20:15:15 1104

原创 Machine Learning——Norm regularization(范数正则化L0、L1、L2)

简单介绍下监督机器学习的基本内容与形式化目标函数监督机器学习:在规范化参数的同时最小化误差。(1)最小化误差:训练模型,使其尽可能拟合训练数据(2)规范化参数:防止模型过分拟合训练数据------> 过分拟合:参数太多导致模型的复杂度上升,这时模型队训练数据可很好估计,但对于测试数据误差增大基于监督的机器学习的模型训练目标是使用相对简单的模型对测试误...

2017-05-12 10:25:07 2634

原创 Algorithm——Quicksort(快速排序)

自己总结的快速排序的code,之前一直处于半懂状态,自己敲定代码后觉得才是真的懂了!#include <iostream>using namespace std;#define maxn 65536int arr[maxn];void quicksort(int arr[], int begin, int end){ if (begi...

2017-05-11 15:56:23 466

原创 Binary Tree——给定二叉树的前序遍历和中序遍历重建二叉树

题目描述:输入某二叉树的前序遍历和中序遍历的结果,请重建出该二叉树。假设输入的前序遍历和中序遍历的结果中都不含重复的数字。例如输入前序遍历序列{1,2,4,7,3,5,6,8}和中序遍历序列{4,7,2,1,5,3,8,6},则重建二叉树并返回。参考答案/** * Definition for binary tree * struct TreeNode { * ...

2017-05-11 10:42:35 282

原创 Machine Learning——Logistic Regression(逻辑回归)

逻辑回归(LR)虽然名字带“回归”,但它却是一种分类方法,用于二分类问题。具体过程:1. 构造预测函数逻辑回归对应二分类问题,因此需要寻找一个预测函数h,该函数的输出是两个值。一般采用sigmoid函数,其函数形式如下所示:此函数对应一个取值在0和1之间的光滑曲线。在此,仅考虑数据部分为线性边界的情况,对应的边界如下:...

2017-05-08 18:51:31 406

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除