1. 基于内容的推荐系统
(1)推荐系统的应用很广泛:
1)电子商务:根据客户购买和浏览商品推荐相关商品
2)电影和视频推荐:根据视频浏览记录,喜好推荐
3)音乐电台的推荐
4)网页及新闻:推荐根据网页浏览记录,推荐相关新闻和网页
5)社交网络:推荐好友,信息流的会话推荐
6)广告推荐等
(2)电影推荐举例
电影资讯网站,用户对于电影的打分(1 - 5 分),代表用户没有评价过该电影,数据,对于每部电影都给出了两个评价指数,构成了电影的二维特征向量 x :x1=电影的浪漫指数,x2=电影的动作指数,详情如下:
movie | Ac | Bo | Ca | Da | romance(x1) | action(x2) |
---|---|---|---|---|---|---|
Love | 5 | 5 | 0 | 0 | 0.9 | 0 |
Romance | 5 | ? | ? | 0 | 1.0 | 0.01 |
Cute love | ? | 4 | 0 | ? | 0.99 | 0 |
Nonstop car | 0 | 0 | 5 | 4 | 0.1 | 1.0 |
Swords vs karate | 0 | 0 | 5 | ? | 0 | 0.9 |
假设用户 i 对于每个指数的偏好程度由向量 θ(i)所衡量,则估计该用户对电影 j 的打分为: y ( i , j ) = ( θ ( j ) ) T x ( i ) y^{(i,j)}=(θ^{(j)})^Tx^{(i)} y(i,j)=(θ(j))Tx(i)
另外,引入 r(i,j) 表示第 i 个用户是否对第 j 部电影进行了打分,打分了为1,未打分为0。
(3)优化目标函数
对用户 j 打分状况作出最精确的预测,优化函数为: m i n ( θ ( j ) ) = 1 2 ∑ i : r ( i , j ) = 1 ( ( θ ( j ) ) T x ( i ) − y ( i , j ) ) 2 + λ 2 ∑ k = 1 n ( θ k ( j ) ) 2 min (θ^{(j)}) =\frac{1}{2}\sum_{i:r(i,j)=1}((θ^{(j)})^Tx^{(i)}−y^{(i,j)})^2+\fracλ2\sum_{k=1}^n(θ^{(j)}_k)^2 min(θ(j))=21i:r(i,j)=1∑((θ(j))Tx(i)−y(i,j))2+2λk=1∑n(θk(j))2那么对于所用用户 1,2,…,nu ,需要: m i n ( θ ( 1 ) , θ ( 2 ) , … … , θ ( n u ) ) = 1 2 ∑ j = 1 n u ∑ i : r ( i , j ) = 1 ( ( θ ( j ) ) T x ( i ) − y ( i , j ) ) 2 + λ 2 ∑ j = 1 n u ∑ k = 1 n ( θ k ( j ) ) 2 min (θ^{(1)},θ^{(2)},……,θ^{(n_u)}) =\frac{1}{2}\sum_{j=1}^{n_u}\sum_{i:r(i,j)=1}((θ^{(j)})^Tx^{(i)}−y^{(i,j)})^2+\fracλ2\sum_{j=1}^{n_u}\sum_{k=1}^n(θ^{(j)}_k)^2 min(θ(1),θ(2),……,θ(nu))=21j=1∑nui:r(i,j)=1∑((θ(j))Tx(i)−y(i,j))2+2λj=1∑nuk=1∑n(θk(j))2则得到代价函数 J ( θ ( 1 ) , θ ( 2 ) , . . . , θ ( n u ) ) J(θ^{(1)},θ^{(2)},...,θ^{(n_u)}) J(θ(1),θ(2),...,θ(nu)) 为: J = 1 2 ∑ j = 1 n u ∑ i : r ( i , j ) = 1 ( ( θ ( j ) ) T x ( i ) − y ( i , j ) ) 2 + λ 2 ∑ j = 1 n u ∑ k = 1 n ( θ k ( j ) ) 2 J=\frac{1}{2}\sum_{j=1}^{n_u}\sum_{i:r(i,j)=1}((θ^{(j)})^Tx^{(i)}−y^{(i,j)})^2+\fracλ2\sum_{j=1}^{n_u}\sum_{k=1}^n(θ^{(j)}_k)^2 J=21j=1∑nui:r(i,j)=1∑((θ(j))Tx(i)−y(i,j))2+2λj=1∑nuk=1∑n(θk(j))2
(4)梯度下降
θ 0 j = θ 0 j − α ∑ i : r ( i , j ) = 1 ( ( θ ( j ) ) T x ( i ) − y ( i , j ) ) x 0 ( i ) θ^{j}_0 = θ^{j}_0 - α\sum_{i:r(i,j)=1}((θ^{(j)})^Tx^{(i)}−y^{(i,j)})x^{(i)}_0 θ0j=θ0j−αi:r(i,j)=1∑((θ(j))Tx(i)−y(i,j))x0(i) θ k j = θ k j − α ( ∑ i : r ( i , j ) = 1 ( ( θ ( j ) ) T x ( i ) − y ( i , j ) ) x k ( i ) + λ θ k j ) , k ≠ 0 θ^{j}_k = θ^{j}_k - α(\sum_{i:r(i,j)=1}((θ^{(j)})^Tx^{(i)}−y^{(i,j)})x^{(i)}_k+λθ^{j}_k)\quad\quad,\quad\quad k \neq 0 θkj=θkj−α(i:r(i,j)=1∑((θ(j))Tx(i)−y(i,j))xk(i)+λθkj),