Paper notes（1）：社会标签推荐张量分解方法研究

最新推荐文章于 2020-05-16 16:47:36 发布

coldsun233

最新推荐文章于 2020-05-16 16:47:36 发布

阅读量323

点赞数

分类专栏： paper notes

本文链接：https://blog.csdn.net/coldsun233/article/details/106031435

版权

paper notes 专栏收录该内容

5 篇文章 1 订阅

订阅专栏

本文针对社会标签数据集的稀疏性和语义丢失问题，提出了一种低阶张量分解（LOTD）算法。该算法通过张量结构表示数据，用0阶、1阶、2阶多项式分解，有效处理了数据稀疏和缺失值，提高了推荐标签的精度和召回率。此外，还介绍了一种新的三部图张量分解方法，增强数据信息的完整性，降低了语义损失。

摘要由CSDN通过智能技术生成

Paper notes（1）：社会标签推荐张量分解方法研究

本文只是个人用于记录论文学习笔记，如有写错的地方还望各位大佬批评指正。

1. 解决的问题

现有的大多数基于张量分解的标签推荐算法对社会标签数据集的极度稀疏性、存在大量稀疏值的特点无法实现理想的处理。
社会标签数据通常被描述为一个三部超图模型，该模型在维度转换过程中总是存在语义丢失的情况。

2. 解决的方法

提出了一种低阶张量分解算法，将社会标签数据集用张量结构来表示，并用低阶多项式进行分解，其中低阶多项式主要吧包括0阶、1阶、2阶多项式。这种方法有效的解决了数据极度稀疏和缺失值的问题，提高了推荐标签的精度和召回率。
提出一种新的三部图张量分解算法，对三部图结构用张量的方法进行分解，分解产生的二维关系矩阵除了包含相应两个维度之间的直接关系，还包含了同时存在于原有三个维度之间的关系信息，表达的数据信息更加完整，精度更高，能有效解决语义丢失的问题

3. 文中用到的符号定义

3.文中的低阶张量分解算法（LOTD）

张量分解关系示意图
该模型的表达式为：
$Y_{ijk} = d + a_i + b_j + c_k + U_{ij}+V_{ik}+W_{jk}$
将该模型的参数综合为 $\theta=(a, b, c, d, U, V, W)$ ，则目标函数为：
$\min_\Theta J = \sum_{ijk} (X_{ijk}-Y_{ijk}(\Theta))^2$
当 $\theta$ 中的每一个成员均取最优解式，即当：
$d=X_{***}\ , a_i=X_{i**}\ , b_j=X_{*j*}\ , c_k=X_{**k} \\ U_{ij}=X_{ij*}\ ,V_{ik}=X_{i*k}\ ,W_{jk}=X_{*jk}$
时,目标函数取得最小值。

算法伪代码描述如下：

该算法的空间复杂度为 $O(N_iN_j+N_iN_k+N_jN_k)$ ，时间复杂度为 $O(K(N_iN_j+N_iN_k+N_jN_k))$ 其中K表示迭代次数。
注：关于缺失值填充本文采用的是赋值为改张量三个维度的平均值。

coldsun233

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Paper notes（1）：社会标签推荐张量分解方法研究

Paper notes（1）：社会标签推荐张量分解方法研究1. 论文的创新点功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入1. 论文的创新点我们对Markdown编辑器进行了一些功能拓展与语法支持，除了标准的Markdo
复制链接

扫一扫

专栏目录