先看一张图。
这张图反映的是浙江移动号码进行点对点群发的情况。从图中可以看出:从2007年10月开始浙江的点对点群发量迅速下降,至今一直保持在较低水平。
浙江移动所用的办法就是:号码离散度分析法。
(一)分析原理
一项技术要被用来打击点对点群发,须满足以下要求:
1、准确:必须能够准确地将群发号码揪出来,不会误伤正常用户。
2、高效:以浙江为例,每月短信次数超过50亿,这要求处理程序必须非常高效,否则可能影响计费系统正常运行。一般来说,唯有简单,才能高效。
3、及时:必须及时发现群发号码,太晚发现就没有意义了。
号码离散度分析法就是一种能够满足以上要求的技术。
号码离散度分析法基于以下两个基本常识:
1、一个人的交往圈总是有限的。
2、一个正常用户基本上都要打电话。
所以若一个号码在短时间内向过多对象发送短信,却不通话,那么这个号码基本上就是群发号码。这就是号码离散度分析法的基本原理。
(二)分析过程
显然,短信群发监控最好能够做到实时。但这往往是没有真正接触过计费系统的人的幻想,因为这样做的代价实在过于高昂。从这些年的分析经验来看,实时监控并无必要性,只要能做到按天监控,基本上就能达到99%的控制效果。
号码离散度分析法具体过程如下:
1、找到嫌疑号码
每天凌晨,分析程序自动扫描前一天的短信话单表,找出交往圈超过门限值(比如300)的号码,插入嫌疑号码表中。
完成这个操作核心的语句只有一条SQL,示意如下:
SELECT 手机号码, COUNT(DISTINCT 对端号码) 对端个数,COUNT(1) 群发次数
FROM CDR_SMS_XX_XX
WHERE 短信类型 = ‘点对点’
GROUP BY 手机号码
HAVING COUNT(DISTINCT 对端号码)>=300;
从浙江这边情况下,在每天1.8亿短信话单情况下,串行执行时间大概两个小时左右。若分地区并行执行,那么30分钟能够搞定。由于该程序在凌晨执行,与计费处理的高峰是错开的,所以并不会显著增加计费系统的系统开销。
除该步骤外,后续步骤都不需要接触话单表,都是回绕找出的少量嫌疑号码来进行分析和处理,保证了整个分析法的性能。
2、排除正常号码
第一个步骤找出的嫌疑号码中可能存在正常的号码,特别是在节假日的时候,所以需要依据一些其他信息进行正常号码的排除。
当然,也可以采取不进一步排除,或
号码离散度分析法在打击点对点群发中的应用
最新推荐文章于 2023-06-10 14:58:27 发布