论文阅读笔记
文章平均质量分 94
梦否
迷茫时多读书,烦躁时勤锻炼,读书时深思考。
展开
-
【兴趣阅读】Adversarial Filtering Modeling on Long-term User Behavior Sequences for Click-Through Rate Pre
丰富的用户行为信息对捕获和理解点击率预测用户兴趣是及其重要的。最近的研究者提出了几种方法来处理短期-长期行为序列和建模用户兴趣。这些方法没有很好的处理在长期用户行为中的噪声信息,而这可能会明显影响到点击率预测的性能。故而这篇论文提出了一个新奇的对抗过滤模型(),在该模型中使用一个对抗的过滤机制,可以移除无用的行为信息。由于用户历史数据的迅速增长,在点击预测()任务中用户行为建模被广泛采纳,主要目的是从用户历史行为数据中捕捉到用户兴趣,而且对于推荐系统和在线营销有着至关重要的作用。现有模型主要针对短期用于行为原创 2022-07-02 13:05:35 · 447 阅读 · 0 评论 -
【兴趣阅读】DeepInf: Social Influence Prediction with Deep Learning
在公众号看到一篇感兴趣的论文:[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lbXtcqwY-1654744059495)(imgs/1654137747852.png)]地址:https://arxiv.org/pdf/1807.05560.pdf代码地址:https://github.com/xptree/DeepInfDeepInf: Social Influence Prediction with Deep Learning在摘要中作者也提出了本文的研究其实为“soc原创 2022-06-09 11:11:57 · 542 阅读 · 0 评论 -
Role2Vec: Learning Role-based Graph Embeddings
Role2Vec: Learning Role-based Graph EmbeddingsStatistical Relational AI Workshop - IJCAI-18文章目录Role2Vec: Learning Role-based Graph Embeddings1. 前言2. Learning Role-based Graph Embeddings 简介3. Framework3.1 Mapping Vertices to Vertex-Types3.2 Attributed Ran原创 2021-11-18 20:07:04 · 1716 阅读 · 1 评论 -
Inf2vec: Latent Representation Model for Social Influence Embedding
Inf2vec: Latent Representation Model for Social Influence Embedding2018 IEEE 34th International Conference on Data Engineering1. 前言感觉这篇文章和自己之前做的研究方向挺相似的,所以这里想更加细致的看看这个工作,看有什么不同。且有什么值得注意和改进的。所以,看这篇论文的目标是:完全理解这篇文章在做什么;理清楚和自己之前做的工作有什么本质上或者表面上的区别;代码复现;原创 2021-11-16 09:06:14 · 1926 阅读 · 0 评论 -
Large-Scale Data-Driven Airline Market Influence Maximization
文章目录1. 前言2. MIM3. 感悟1. 前言前几天的论文阅读分享中我汇报的是这篇论文。感觉挺棒的,这里简单记录一下。2. MIM这里我将本文的Market Influence Maximization,简称为MIM问题。本文作者针对美国航空市场的收益问题提出了新的解决方案。提出了一个 Market Share Prediction Model以及后面的Market Influence Maximization两个部分的内容。本文模型和之前的模型的区别在于下面几个点:当然,作者对比的部分只是原创 2021-11-05 09:57:45 · 185 阅读 · 0 评论 -
关于随机游走的一个小实验
实验目的:阅读源码DeepWalk中的随机游走算法,然后单独抽离出来,做训练语料库,然后学习每个节点的向量表示,最后计算相似度,统计,并得出逻辑上的意见领袖节点(基于上面的那个相似观点来的)。代码如下:import random as randdef getPath(start, nx_G, path_length, alpha): if start: path = [start] else: # Sampling is uniform w.r.t V原创 2020-11-17 14:48:00 · 959 阅读 · 2 评论 -
内容增强网络表示学习的一般框架(A General Framework for Content-enhanced Network Representation Learning)(4)
再次整理下思路,因为上一篇整错了。1)表示整个网络,包括node-node和node-content;2)使用node2vec学习的是原本的节点的表示,不是虚拟的节点的表示,即不将1中的整体图用来做随机游走;3)使用sent2vec学习虚拟节点的嵌入表示,即内容;存在问题node2vec中有个函数写错了,导致某些节点总学习不到其向量表示,即:def learn_embeddings(walks): # storage ⇒ 这里的存储和for循环,之前写反了 filename =原创 2020-10-15 14:36:37 · 268 阅读 · 0 评论 -
内容增强网络表示学习的一般框架(A General Framework for Content-enhanced Network Representation Learning)(3)
在上篇内容增强网络表示学习的一般框架(A General Framework for Content-enhanced Network Representation Learning)(2)对整个网络进行了简单的处理,得到了一个边集关系的文件,我们接下来的节点表示工作,就基于该数据集,当然,要进行将孤立节点也整进去。这里,将使用node2vec来进行嵌入操作,因为这个算法可以看作是对DeepWalk的一个扩展,也比较成熟。简单抄抄介绍:node2vec是一种综合考虑DFS邻域和BFS邻域的graph原创 2020-10-11 15:03:08 · 330 阅读 · 0 评论 -
内容增强网络表示学习的一般框架(A General Framework for Content-enhanced Network Representation Learning)(2)
在上篇内容增强网络表示学习的一般框架(A General Framework for Content-enhanced Network Representation Learning)(1)中,我们可以了解到这个学习框架的基本构成,这篇文章就来简单的实现下。前提假设即:SPSPSP 是通过随机游走所生成的路径上的邻接节点对;SNSNSN 是所有的负采样的集合;节点eue_ueu的数值化表示为节点的嵌入表示,类似与DeepWalk、node2vec等任务1)整合node-node连接、nod原创 2020-10-10 20:17:56 · 356 阅读 · 0 评论 -
内容增强网络表示学习的一般框架(A General Framework for Content-enhanced Network Representation Learning)(1)
题目A General Framework for Content-enhanced Network Representation Learning题目分析(analysis):1)结构+内容的Network Embedding;2)Content-enhanced,应该注意内容如何enhance;摘要现有的网络嵌入方法大多只依赖于网络结构,而忽视了能够代表这个节点的丰富的相关文本信息。本文提出内容增强网络嵌入(CENE),来联合学习这两个部分的信息。该方法将内容信息作为一种特殊的节点来处理,将原创 2020-10-09 20:17:43 · 554 阅读 · 0 评论 -
DeepWalk粗解
本文将图网络上随机游走(Random Walk)和自然语言处理中的skip-gram语言模型相结合起来,而产生了在网络表示学习(Network Embedding)在与NLP相结合的第一篇开山之作。理论支撑也即是在无标度网络中,网络中节点的度分布服从幂律分布。而在此网络中采样后的节点出现频率也服从幂律分布,类似的在将文本进行随机游走的时候同样服从幂律分布。故而这种随机游走的采样没有改变网络整体的结构,是合理的(网络的特性与自然语言处理中的特性十分类似)。方法从一个节点v4v_4v4出发,进原创 2020-10-08 15:37:18 · 212 阅读 · 0 评论 -
DeepWalk初探
欲实现下面的一个效果:数据集的获取,可以利用networkx中的集成的Karate图来得到,获取数据集到原始的CSV文件,在上篇(处理数据的常见操作)中有介绍,这里不再介绍。那么,首先我们需要使用louvain算法来进行这个数据集的社区的划分,同样的前面也介绍过,这里不再重复。这里直接改变划分后的节点的颜色即可,代码如下:import community as community_louvainimport matplotlib.cm as cmimport matplotlib.pyplot原创 2020-10-07 22:24:53 · 417 阅读 · 0 评论 -
SIR模型的应用(2) - Influence maximization in social networks based on TOPSIS(3)
上篇中我们说道了,需要注意作者是如何将SIR应用到种子节点的传播过程之中的。那么我们就来看看作者是如何做的。思考不妨先思考下:① 初始时刻,处于I状态的是种子节点,其余节点是易感节点;② 在进行传播时,传播的途径是节点之间的连接边;也就是在SIR模型进行传播的时候,需要满足两个条件:1)该节点到目标节点之间有直接连接边;2)待传播节点是易感节点,即S;文中均匀模型,图中所有边的传播概率均是β;基于度的模型,节点v到节点u的传播概率可以计算为1/du1/d_u1/du思考由于,我们原创 2020-10-04 20:23:09 · 1145 阅读 · 10 评论 -
SIR模型的应用 - Influence maximization in social networks based on TOPSIS(3)
在Influence maximization in social networks based on TOPSIS一文中,作者利用SIR模型如下:即:种子节点处于感染阶段,其余节点处于易感,最终的评判以网络中恢复的人数来判断。那么,不妨来了解下SIR模型是如何工作的。SIR模型经典的SIR模型提出比较早,我们都知道它存在三种状态,分别是:Susceptible:易感人群,指未得病者,但缺乏免疫能力,与感病者接触后容易受到感染;Infective:感染人群,指染上传染病的人,他可以传播给易感人原创 2020-10-03 16:37:33 · 1013 阅读 · 2 评论 -
关于上两篇文章的思考
今天读论文,在Influence Maximization on Large-scale Networks with a Group-based Method via Network Embedding一文中,提出了diffusion-aware random walk sampling strategy。回顾在Community aware random walk for network embedding一文中提出了Community aware random walk sampling strateg原创 2020-09-30 10:05:42 · 180 阅读 · 0 评论 -
Influence maximization in social networks based on TOPSIS(2)
按照上一篇中所描述的算法逻辑和相关的伪代码,可以得到在文中所定义的初始决策矩阵A,即:同样的,所用数据集是karate_club_graph数据集,其图形之前绘制过,如下图:在jupyter notebook中运行,可以比较方便的看到这个矩阵的结构:注意这个矩阵的名称,叫做(decision matrix)决策矩阵,结合TOPSIS法(优劣解距离法)介绍及 python3 实现一文中的详细解释TOPSIS算法,我们知道,可以直接将我们得到的初始决策矩阵用来作为判别的四个指标。但有点不想写top原创 2020-09-29 16:48:11 · 398 阅读 · 0 评论 -
Community aware random walk(2)
在上篇Community aware random walk虽然使用了gensim中封装好的word2vec来大致实现了这个算法,但是实际上和论文中的框架图还是有很大的区别的,如下图:从图中可以看出,文中使用word2vec得到的是这个节点的一个网络嵌入表示,也即是一个行向量。而我在使用gensim来实现的时候,实际上输出的是一些最相似的点集,代码如下:# 加载生成的语料库,输入到skipgram模型中,用于计算K相似def generate(): sentences = word2vec.原创 2020-09-28 10:32:44 · 238 阅读 · 3 评论 -
Influence maximization in social networks based on TOPSIS(1)
今天发现了一个社交网络数据集网站:Network data对于这篇文章Influence maximization in social networks based on TOPSIS,在早些时候,就看见了CSDN上的大佬实现了这个文章的代码。但是,在这里还是想自己来复现下,加入自己的一些粗浅的见解。就来再读一下,然后实现代码逻辑功能。提出的原因IM问题,常常都是考虑如何选择特定的有影响力的用户作为种子节点,而往往忽视了所选择用户之间的距离(distances),它可以用来确保对大规模社交网络的最小重原创 2020-09-29 09:04:39 · 826 阅读 · 0 评论 -
Community aware random walk
Community aware random walk for network embedding该文中提出了一中网络嵌入方法,来解决本地和全局的网络结构信息的保留。可以简单的理解为:通过算法2来从整个图中随机游走获得游走序列,然后将这个序列输入到Skip-gram算法中, 然后可以得到该序列的一个vxd中的一个行或者列向量表示(算法1),最终这些向量构成U矩阵,也就是整个网络的网络嵌入表示。在2019年,本文作者将这个方法应用在了Influence maximization across het原创 2020-09-26 15:01:39 · 450 阅读 · 0 评论 -
Discover opinion leader in online social network using firefly algorithm (阅读笔记二)
上一篇中,讲解了论文中涉及的两种算法的基本形态的讲解,接着我们来谈谈这篇论文。对于一个社会网络,我们需要划分社区,而划分社区的方法就是前面讲到的Louvain社区发现算法,在论文中使用的是改进的Louvain社区发现算法,怎么改进呢,如下:改进的也就是上面的节点的聚类系数CxC_xCx,但是其实它的划分社区的过程还是前面的划分社区的方法。社区划分了以后,就使用改进的萤火虫算法,所谓的改...原创 2019-12-06 08:58:00 · 338 阅读 · 0 评论 -
Discover opinion leader in online social network using firefly algorithm (阅读笔记一)
题目译:使用firefly算法发现在线社交网络中的意见领袖发布于:《Expert Systems With Applications》主要思想:这篇论文有两个阶段,一是在大网络中发现社区,二是在发现到的社区中用萤火虫算法去发现意见领袖。这两个阶段,在本论文中的体现就是两个改进的算法,分别是改进的Louvain社区发现算法和改进的萤火虫发现算法。论文结构首先,处理有关标识意见领袖的相关文...原创 2019-12-02 15:29:04 · 640 阅读 · 0 评论