算法
文章平均质量分 84
阿宣22
这个作者很懒,什么都没留下…
展开
-
推荐系统学习之概率算法及其增量算法
谈到推荐吧,我知道的也很少,总括的这种就不吹了。第一个和概率有关的推荐算法应该是**“关联规则挖掘”**,就是置信度、支持度那个,我就不多言了,接下来一个的则是**“Page Rank”**,这一个方法曾经被广泛的用于搜索引擎的网页排名中,亦是本文将要关注的重点对象。而选择这一个**too young too naive**的算法出发的原因就是**it is simple and beautiful**。原创 2016-01-25 19:30:59 · 3586 阅读 · 0 评论 -
小样本分析(三)
虔诚的我提出一个问题,希望知识能给我答案,然而他以一个新的问题作为回答。 导读: 这篇是继前两篇小概率估算的后续,很多地方没有说,建议先粗略看一下前面的,了解一下估算的思路。由于公式较多直接从word截图偷个闲。 条件极值: 【注:拉格朗日乘数法我也忘记得差不多了,在网上找到的例子也主要是只有一个约束条件,这里到两个约束的拓展有点不确定,但是先做了】 不难发现在 al原创 2015-10-07 19:04:34 · 4528 阅读 · 0 评论 -
GBDT 学习
这么多乱七八糟的“算法”,为什么要学GBDT呢?主要是最近听到这个名词比较多,想了。那么为什么要再写GBDT呢(鉴于各种牛人满天飞,我怎么就好意思献丑了)?着实是看看了网上一些博客后,有很多疑问,后来自己把这些疑问解决了,就想着分享一下,减少大家的学习成本。所以我就不再从头说起了,新朋友可以参拜一下以下文章。原创 2016-05-01 17:04:27 · 3693 阅读 · 0 评论 -
集合的最优分组问题
问题仓库人员需要按照订单上的信息将商品从货架上拣选出来,这些订单大致形态如下:订单1:{商品1、商品2、商品3} 订单2:{商品2、商品3、商品5、商品6、商品7} 订单3:{商品1、商品4} …… 订单10000:{商品239、商品445、商品500}假定总共1万订单,商品种类500种。在这些订单中的商品不大于10种,至少有1种,以1-5种商品组合的订单数量为最多,很多订单的商品组合可能很原创 2017-01-18 16:49:55 · 3449 阅读 · 0 评论 -
SVD 梯度下降
# coding=utf-8 import numpy as np import time import math __author__ = '01053185' # 2015年 9 月 25 日 class XMatrix(): def __init__(self, m=1000, n=100, step=4): self.zero_like = 0.01 # 伪零:原创 2015-09-25 21:53:30 · 3719 阅读 · 2 评论 -
协同过滤中显性反馈 与 隐性反馈 的区别(附ALS最优化)
协同过滤中显性反馈 与 隐性反馈 的区别1. 特质上的区别显性反馈行为:用户明确表示对物品喜好的行为。 隐性反馈行为:不能明确反映用户喜好的行为。隐性反馈的特性 没有负反馈。隐性反馈无法判断是否不喜欢。而显性反馈,明显能区分是喜欢还是不喜欢。 先天性具有噪声。用户购买了某物品,并不代表他喜欢,也许是送礼,也许买了之后发现不喜欢。 显性反馈数值代表偏好程度,隐性反馈数值代表置信度。隐性反馈的数值通常原创 2017-07-07 18:52:03 · 5930 阅读 · 0 评论 -
FM的快速增量算法猜想
背景接触FM方法时间也算是很久了,虽然没有持续在上面做非常深入的研究,但是做的几个项目中,多次使用后也算是也算是业余玩家中的高端玩家了。在前期的一个项目中深入的参与了spark中的ALS推荐模型(其实本质是FM,als是指其中最优化的算法),其中主要参与解决的问题就是增量推荐(场景中是解决新用户的推荐问题),其中具体的思路就是固定住物品矩阵单独训练每个用户的评分内容,具体就不赘述。但是该方法效率非常原创 2017-11-28 20:18:08 · 789 阅读 · 0 评论