随着互联网的迅速发展,人民对邮件的使用不断扩大,反垃圾邮件也成了当务之急。据有关部门统计,2006网民收到垃圾邮件总量为500亿封,对我国国民经济造成的经济损失约为104.315亿人民币;2007年网民收到垃圾邮件总量为694亿封,损失188.4亿元;增长率为38.8%垃圾邮件时消耗网络资源的罪魁祸首,当然防垃圾邮件是一个任重道远。 在用户收到的垃圾邮件类型中,排在前三位的依次是:网上购物类垃圾邮件、网上赚钱类垃圾邮件、情趣用品类垃圾邮件,其所占的比例分别为:17.57%12.55%9.21%。其次为******型垃圾邮件,含有病毒的垃圾邮件等。<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

    目前防垃圾邮件的主要技术与方法手段

1        政府支持和规范邮件;采取应对防范措施

各国政府都在不断的通过规范和相应措施拉预防垃圾邮件。在中国,2002中国成立了中国互联网协会发垃圾邮件协调小组;20036月开展了《中国互联网协会反垃圾邮件规范》、《公共电子邮件服务规范》;同年8月首次公布垃圾邮件“黑名单”;2005年底中国互联网协会反垃圾邮件工作委员会成立;2006年颁布实施《互联网电子邮件服务管理办法》;开通举报电话,邮箱。

在国外,国际电信联盟,经济合作组织,亚太法垃圾邮件联盟,美国联邦贸易委员会,韩国信息安全署,澳大利亚通信管理局,日本互联网协会等单位加入到《首尔·墨尔本法垃圾邮件多边合作协议》,通过互换数据来预防和反垃圾邮件。

2        现在反垃圾邮件的主要技术途径

1)  国际同步垃圾邮件黑名单、关键字、自定义、IP地址、域策略过滤;

各防垃圾邮件网关厂商同步于国际垃圾邮件黑名单,主要是一些被动的阻止垃圾邮件进入邮件系统;通过策略来过滤关键字,自定义的域,IP地址;通过内容、散列值过滤;这种过滤规则误判率很高,绕过规则很容易;管理员必须手动更新过滤规则。

另外,全文内容或散列值过滤得方法,也有打分制。对自定义的关键字设定一个分值,然后设定一个阀值,如果此封邮件所触犯的所有规则分数总和大于这个阀值,则判定为垃圾邮件。这种过滤规则的要通过长时间来观测其企业的主要垃圾邮件的内容,频率来定义分值。对于新型的垃圾邮件管理员要手动快速准确的判断并定义其关键字的分值。对于没有任何可以触犯的关键字的邮件,这邮件只是为了堵塞通道或者增加邮件服务器的转发压力,使得正常邮件也产生很长的延迟,影响正常工作。如果用智能的处理这些问题,那就是更方便用户。从行为识别模式来判断垃圾邮件,就如贝叶斯模型来处理垃圾邮件。我们引入下面的模型。
2) 行为 识别模型
是通过分析统计“小偷的行为心理异于常人”的原理,行为模式识别模型包含邮件发送过程中的各类行为要素,主要包括:时间,频度,发送IP,协议声名特征、发送指纹等。贝叶斯过滤是通过统计过滤的方式实现防垃圾邮件的。统计过滤技术使用规则来衡量邮件消息的频率和模式,产生置信区间。同时把相应判定为垃圾邮件的关键字自动更新到关键字库中。
  3)  电子邮件认证技术

这种技术主要基于发件人策略框架,发件人标识,域密钥和互联网邮件标识等技术实现的。电子邮件认证技术主要是针对垃圾邮件伪造域或者回复地址有效阻断技术。这种技术实现和应用费用比较高。不适合有自己邮件服务器和邮件网关的企业。

     以上几种方法都是以防为主,是被动模式下的运算。而现在比较新的方法则是把被动变为主动;也就是主要抓垃圾邮件发送的特点来处理垃圾邮件。即:小偷心理行为,也就是上面提到的;另为,主要以群发为主。抓住第二种方法来处理,把被动变为主动,也就是通过几次握手来防垃圾邮件。垃圾邮件为一般只发送一次;当正常邮件发送时,一般都是投递一次不成功,则在一定时间后继续投递,如果我们设定投递三次为正常邮件的阀值,那前两次都发送方申请连接时,直接拒绝掉。这样就可以处理到那些群发的垃圾邮件了。

    以上是我自己总结出来的目前的方法,若那位仁兄还有更新的方法,可以共享。