task01 图相关基础和算法举例分享

学习内容中的介绍已经非常精简,不再做重复的总结。今天主要写一下自己在工作中积累的对图相关理解和经典算法的介绍。

图的基本分类

图从node的类型可分为同构图和已构图两类:

  1. 同构图:图中的所有结点均为同一类型的,例如在社交网络中,所有的用户可作为结点构成一张图,用户与用户之间是否有关联决定了结点与结点间是否有边;
  2. 异构图:图中的结点类型数>=2,例如在社交网络中,用户、博主、推文可以作为三种类型的结点构成已构图,其中用户、博主、推文的相互关注、订阅情况决定了图中边的情况。

二分图是异构图中的比较常见的一种,顾名思义,二分图是指结点类型数为2的图,例如在电商常见中,买家和卖家可作为不同类型的结点,买家和卖家间是否有订单/行为是否有关联决定了结点与结点间是否有边。

二分图业务问题以及解决方案举例

在电商业务场景中,通常会存在一批买家在一批卖家下大批量下单,从而实现为商家提供更好的订单量数据和GMV数据的目的,这种行为被称为刷单。而识别这一异常行为常用的就是图的密集检测算法,例如M-zoom、fraudar、catchsync、synchroTrap等;这类算法通常的思路是把构建的二分图切分成若干个较小的连通子图,进而识别小的连通子图中是否存在异常聚集的现象,例如该连通子图中的密集度过高,密集度的计算公式如下:
d e n s i t y = ( 连通子图中实际存在的边个数 ) / ( 完全连通子图边个数 ) density =(连通子图中实际存在的边个数)/(完全连通子图边个数) density=(连通子图中实际存在的边个数)/(完全连通子图边个数)
其中 d e n s i t y ∈ [ 0 , 1 ] density\in[0,1] density[0,1],其值越大表示该连通子图中的边越密集,风险也越大。这类较为简单的算法仅仅使用图结构信息就可以在检测异常上取得较好的效果,如果再加入结点的信息,将会有更好的检测效果。

  • 13
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
逆向最大匹配算法是一种中文分词算法,它从待分词文本的末尾开始,选择词典中最长的词作为匹配的片段,然后将该片段从文本中移除。这个过程会一直重复,直到文本为空或无法再匹配出词。以下是一个例子来说明逆向最大匹配算法的运行过程。 假设我们有一个待分词的句子: "中文分词是一项重要任务"。我们使用逆向最大匹配算法对其进行分词。 首先,我们从句子的末尾开始,选择词典中最长的词进行匹配。在这个例子中,最长的词是"任务"。我们将"任务"从句子中移除,并将其作为分词结果的一部分。 接下来,我们继续从句子剩余部分的末尾开始匹配,找到词典中最长的词。在这个例子中,剩余的部分是"中文分词是一项重要",最长的词是"重要"。我们将"重要"从剩余部分中移除,并将其作为分词结果的一部分。 最后,我们继续匹配剩余部分的最长词。在这个例子中,剩余的部分是"中文分词是一项",最长的词是"中文"。我们将"中文"从剩余部分中移除,并将其作为分词结果的一部分。 最终,我们得到的分词结果是:"中文"、"分词"、"是"、"一项"、"重要"、"任务"。这个例子展示了逆向最大匹配算法在对句子进行分词时的运行过程。 引用中提到,逆向最大匹配算法虽然简单,但在处理一些语句上不能准确地分词。现在的分词算法通常采用基于统计概率模型的算法,如maxent或CRF等,这些算法在分词效果上比逆向最大匹配算法好。因此,逆向最大匹配算法在现代中文分词中的应用较少。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [逆向最大匹配分词算法](https://blog.csdn.net/crcr/article/details/123979555)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值