计算机文献阅读
计算机相关文献的阅读和总结
水木流年追梦
清华大学计算机研究生,专研算法工程
展开
-
DeepWalk: Online Learning of Social Representations-2
Language Modeling语言建模的目标是估计语料库中出现特定单词序列的可能性。更正式的是,给定一个单词序列。在训练语料库里最大化在这项工作中,我们提出了一种通用的语言模化方法,通过一系列的随机短游动来研究图形。这些行走可以用一种特殊的语言来思考短句和短语。直接的模拟是估计在目前的随机游走之后发现顶点vi的可能性。我们的目标是学习一个潜在的表示,而不仅仅是节点共现的概率...原创 2019-04-09 10:40:44 · 414 阅读 · 0 评论 -
DeepWalk: Online Learning of Social Representations-1
我们提出了一种新的学习网络中顶点的潜在表示的新方法。这些潜在表达在一个连续的向量空间中编码社交联系,它容易被统计模型利用。Deepwalk概括了语言模型的最近发展,和从单词序列到图的无特征监督学习。我们演示了DeepWalk在几个多标签分类任务的潜在表示,例如BlogCatalog,Flicker,Youtube。我们的结果表明DeepWalk优于具有挑战性的baseline,有一个对网络的全...原创 2019-04-09 10:30:39 · 421 阅读 · 0 评论 -
Label-dependent Feature Extraction in Social Networks for Node Classification
提出了一种基于社会网络特征提取的网络内分类方法。该方法提供了结合网络结构信息和分配给节点的类标签来计算的新特性。研究了不同特征对分类性能的影响。在真实数据上的实验表明,该方法生成的特征可以显著提高分类精度。Introduction有一些应用和研究方法,特别是与社交网络相关的应用和研究方法,能够产生相互连接的对象标签之间依赖的数据,称为关系自相关。根据这些连接,应该向分类过程中添加额外...原创 2019-04-09 10:25:45 · 480 阅读 · 0 评论 -
同质异质网络——(F(fraud) A(Analytics) UDPSNT(Wylie_2015))
当标签x的结点更大程度上连接其他标签x的结点的时候,这个网络是同质的。非同质的网络是异质的。 这里定义的同质异质网络是指行骗者更可能连接着其他行骗者。合法人更可能连接其他合法人。 令l为网络中合法结点的比例,f为网络中欺诈结点的比例,2lf就是一条边连接两个不同标签的结点的期望可能性,这些边叫做cross-labeled edges.如果已知的cross-labeled edges的比例r小于...原创 2019-04-09 10:16:11 · 8345 阅读 · 0 评论 -
Pagerank-2
拓展图有很多的我们可能涉及到的网络图在未来在计算上探索的理想的性能。Searching with PageRankPageRank的一个主要应用是搜索。我们已经实现了两个使用pagerank的搜索引擎。我们首先要讨论的是一个简单的基于标题的搜索引擎。第二个搜索引擎是名为Google的全文搜索引擎。Google利用了一系列的因子去对搜索结果排序包括标准IR度量,接近度,锚文本(链接到网页的文...原创 2019-04-09 10:15:31 · 287 阅读 · 0 评论 -
PageRank
为了衡量网页的重要性,pagerank是一种基于网络图计算每个页面的排名的方法。 通常来说高连接的页面比少连接的页面更重要。 pagerank的直观描述:一个页面有高rank如果它的反向链接的rank和是高的。这包括两种情况,一个页面有很多反向链接和一个页面有一些高rank的反向链接 以上是一个简单的ranking定义 随机游走模型,“random surfer”简单地随机点击...原创 2019-04-09 10:14:13 · 570 阅读 · 0 评论 -
Behavior Language Processing with Graph based Feature Generation for Fraud Detectionin OnlineLending
节点的度描述了与这个信息节点相连的申请节点的个数,也遵循幂律。以公司为例的话就是大规模的公司例如顶尖保险公司和主要的物流公司通常与大量的贷款申请相关联。全局欺诈传播的传播算法是度相关的,有大的度的节点等比例地传播更多欺诈比起低度节点。因此,信息节点的枢纽将会暴漏在大量的欺诈中,从而引起误报。Graph Fraud Feature Extraction在本节中讨论如何以网络分析...原创 2019-04-09 10:02:07 · 472 阅读 · 0 评论 -
Network-based Fraud Detection for Social Security Fraud
这个研究旨在确定那些故意申请破产来避免交税的公司。介绍了一个新的方法关于如何从一个时间加权网络中定义并提取出特征,如何利用整合在欺诈检测中基于网络的本质的特征。 欺诈检测是一个包括很多种类不同的申请者和不同要求的研究领域,包括信用卡欺诈,通话记录欺诈,洗钱,保险欺诈和通讯欺诈。这些问题通常表现出相同的特征,但每个问题的具体解决办法是特定领域的。数据挖掘技术,在大量数据中寻找特征和异常,已经证明...原创 2019-04-09 10:08:44 · 516 阅读 · 0 评论 -
Behavior Language Processing with Graph based Feature Generation for Fraud DetectioninOnline Lending
欺诈检测存在很多挑战:信用相关特征的稀疏性,例如社会保险,工作认证,然而这些对于目标人群来说都是稀疏的。数据的速率、种类和容量。设备的行为数据在容量和维度上有爆炸性的增长,而且行为数据对说明一个人的金融风险很有用,因为它揭示了申请人的兴趣、社会关系、生活方式,很难伪造。实际上问题就是如何整合这些数据并且应用合适的数据挖掘方法去为风险控制提取金融的信号,因为像浏览器日志这样的信息有着复杂的结构。欺诈...原创 2019-04-09 09:59:18 · 444 阅读 · 0 评论