算法基础

最新推荐文章于 2022-01-20 20:48:47 发布

木南曌

最新推荐文章于 2022-01-20 20:48:47 发布

阅读量166

点赞数

分类专栏：算法

本文链接：https://blog.csdn.net/qq_kbyd/article/details/80905716

版权

2 篇文章 0 订阅

订阅专栏

先验概率：是指根据以往经验和分析得到的概率。
后验概率:事情已经发生，要求这件事情发生的原因是由某个因素引起的可能性的大小。
$P(A|B) = \frac{P(A,B)}{P(B)} = \frac{P(B|A) * P(A)}{P(B|A) * P(A) + P(B|C) * P(C)}$

信息: $i(x) = -log(p(x))$
1.如果说概率p是对确定性的度量
2.那么信息就是对不确定性的度量
独立事件的信息
如果两个事件X和Y独立，即 $p(xy)=p(x) * p(y)$ ，假定X和y的信息量分别为i(x)和i(y)，则二者同时发生的信息量应该为 i(x^y)= $i(x)+i(y)$ 。

$I(X;Y) = \sum{P(x,y)* log\frac{P(x,y)}{P(x)* P(y)}}$
$I(X;Y) =H(X)-H(X|Y) = H(Y)-H(Y|X) = H(X,Y)-H(X|Y)-H(Y|X)$

$H(Y|X)= \sum{p(x,y) * log\frac{p(x)}{p(x,y)}}$

$H(X,Y)= -\sum\sum{p(x,y) * log_2{P(x,y)}}$

$H(T;Y)= -\sum{p_t(z) * log_2{p_y(z)}}$
* 衡量两个概率分布的差异性

$KL(f(x)||g(x))= \sum{f(x)*log\frac{f(x)}{g(x)}}$

基于物品的协同过滤
基于用户的协同过滤
协同过滤优点
1  基于用户行为，因此对推荐内容无需先验知识
2 只需要用户和商品关联矩阵即可，结结构简单
3  在用户行为丰富的情况下，效果好
协同过滤缺点
1 需要大量的显性/隐性用户行为
2 需要通过完全相同的商品关联，相似的不行
3  假定用户的兴趣完全取决于之前的行为，而和当前上下文环境无关
4  在数据稀疏的情况下受影响。可以考虑二度关联。

主要想法是，应该有一些隐藏的因素，影响用户的打分
1 比如电影：演员、题材、主题、年代…
2 不一定是人直接可理解的隐藏因子
3 找到隐藏因子，可以对user和item进行关联
用户和被测对象直接分离，通过隐藏因素关联，矩阵相乘。

关注