主持人:殷杰先生是微软的高级讲师,它的题目主要是,其中主要说的是用户的参与和反馈系统。

 殷杰:感谢大家的关注。前面专家讲的主要是概念和趋势。那么我就不重复了。我讲具体的东西讨论一下,只讨论一点就是垃圾的防范。我们讨论的重点就是用户的参与和反馈。那么在前面来宾都看到,我们的it要怎么做,我们网管要是怎么怎么做?首先看一下什么是垃圾邮件。首先看一下垃圾邮件在现在的状况中是非常严重的。以我的例子我的邮箱中平均每天可以收到将近60封的垃圾邮件。占我的邮件的95%以上。所以说垃圾邮件已经站在邮件的70%甚至更高。那么也就是说垃圾邮件已经超过了正常的邮件。全球有邮件145亿封垃圾邮件在发送。这个显然给我们带来了很大的损失。垃圾邮件是为未经允许发送的,处于商业宣传,政治和×××,非正常目的的邮件,病毒邮件等等。垃圾邮件的危害不用解释了。它会占用网络的资源,增加邮件的处理时间,现在一天我要出一百封信可能是没用的。那么垃圾邮件的特点是什么呢?因为现在刚才的地址太多了,包括我自己都可以发垃圾邮件,发件的地址不固定,收件人地址不固定,主题、内容、附件均有相应的随机性和固定性,时间不集中。现在很多的邮件就是直接的图片,或者是文档。垃圾邮件的发送方式很简单,通过服务器发,当然这种情况现在已经很少了。如果你开发一个服务器给谁发邮件,第二天你就上黑名单。再一个通过发送工具直接投递到服务器。组织内的传递邮件是不受控制的。第三种通过自己的邮件服务器发送。第四个通过宽带接入来发送等等。

  接下来我们讨论一个问题,就是为什么会有垃圾邮件。互联网的普及带来的巨大的邮件。因为网络营销中一个非常重要的因素就是邮件营销。而邮件营销的成本非常低。我们知道打一个电话给美国我的需要付出的费用使国际的费用,而电子邮件你付钱了吗?你没有。所以它的成本非常低,范围非常广,速度非常块。一分钟可以发出一千封来。为什么会有人去发邮件呢,因为它的成本低,我不需要支付其他的费用,所以说这是一个非常关键的地方。而且垃圾邮件从目前来说不需要负法律责任,所以这导致公司很多企业会肆无忌惮的发送这种垃圾邮件。而且它会说是一种善意的邮件。

  那么垃圾邮件为什么是很难解决的问题呢?我们听到前面的来宾中提到了,你只要投入大量的资金大量的费用都可以解决。可是垃圾邮件你能解决吗?我敢保证你解决不了的。垃圾邮件从正常来说是没有什么特点的。跟平常的邮件是没有区别的。有的垃圾邮件的本质就是正常的邮件。smtp协议本身的设计缺陷,用户的网络行为不可避免的会泄漏自己的邮件地址。你会登录一些网站,一些论坛,或者登录你的新闻组,如果你写的电子邮件不政府,你将收不到相关的资料。如果你隐瞒电子邮件的地址,你的电子邮件就不会用了。大家可以尝试一下用你的电子邮件作为搜集的条件,你会搜集到很多的邮件。企业对垃圾邮件的防范有什么需求呢?企业对垃圾邮件的防范需求是最高的。如果说防火墙是要求阻挡外来***,有没有人说防火墙是阻挡内部***的。没有吧。而企业一般对垃圾邮件的希望数值是零,而达到零是不可能的。但是这邮件一封都不能隔离,而且拦截的位置最好在网关处拦截,因为用户不可见,投诉少,减少对内部带宽的消耗,减少服务器对垃圾邮件的处理负载。当然这是好处,但是有个缺点是什么缺点呢?因为用户不知道哪些是垃圾邮件。我的服务器不知道哪些是垃圾邮件。所以服务器不可以准确的估计出所有德拉吉邮件。同样管理的需求决定公司和最终用户的统一性是不一样的。所有和我公司有关系的文件就是有用的文件,没有关系的就是垃圾邮件。而用户不是这样想的。我需要在我易贝上买的东西,我订购成功了,可是公司不是这样认为。

  还有识别率和误判率。势必率是能够准确分辨垃圾邮件的能力,它的提高需要更多的垃圾邮件来学习和强化。误判率则是错误的将正常邮件识别为垃圾邮件的比率,它的提高需要更多的正常邮件来学习。非常重要的事实是,垃圾邮件对用户的定义是不一样的。不同用户对统一封邮件的定是木一样的。比如我是销售人员,我对销售特别的关注,可是我们是技术人员,我对销售的数值肯定不感兴趣的。那么我就认为这些是垃圾邮件。不同的用户对于垃圾邮件的敏感程度也是不相同的。垃圾邮件本身也在不断的正常化发展,以规避反垃圾邮件系统的阻拦。用户对邮件的分类依据是不一样的。我们来看一张表,我们看到把邮件从重要程度从最低到最高,我们分了一些类。可以看到破坏性邮件,破坏性邮件比如说病毒,垃圾邮件是在最下边的。而中间有一块,我甚至叫做灰色地带的部分。包括一些广告邮件这些信息它不能够准确定义为垃圾邮件。这份邮件应该在最终用户的分解。所以为什么说垃圾邮件应该由最终用户来进行分解?因为因为用户的需求是不一样的。所以觉得的邮件的类型。用户反馈系统的重要性,灰色地带邮件适合由最终用户分检,学习用户分检的结果,有助于提高反垃圾邮件系统的识别率,降低误判率。用户的大量反馈,可以强化垃圾邮件数据库特征信息。但是遗憾的是,用户反馈也有它的局限性,因为用户反馈是无意识的。所以用户的反馈可能会错误的影响你的垃圾邮件的系统。

  知识系统在用户反馈中的作用,知识系统能通过对样本数据的学习,自动调整对新的数据的适应能力的系统,常见知识系统:贝叶斯、灰名单等等。知识系统可以接受用户反馈信息,以强化其识别垃圾邮件的效率,知识系统自身的特点可以有效的防止或弱化用户的错误反馈。前面我们有些嘉宾也提到过,我前端时间在会谈上也看到过,有人说垃圾邮件的解决方法就是立一个法律,对垃圾邮件的进行罚款一万元的方法,我个人认为是不能解决问题的。因为垃圾邮件你是无法确认是谁确认的。因为它是匿名的。可能是跨地域的,你知道它是哪里发出来的吗?国家是不可能花费大量的人力物力去寻找一个垃圾邮件的。再加上匿名机制大大增加的对垃圾邮件制造者的排查难度,对垃圾邮件和正常商业邮件的界定很困难,但是我们的系统要求不能隔离一条商务邮件,我们就是宁可放过一个,不过错发一千。为此我们要发过一千个甚至一万个垃圾邮件过去。如果你百分之百的隔离,你可以会耽误到一个正确邮件的发送。这就会造成很大的问题。如果邮件允许用户退订,算垃圾邮件吗?按照有关国家的法律,有些法律说商业邮件允许你退订,那么这种算不算垃圾邮件,对我来说我认为它属于垃圾邮件。我觉得这个操作做了以后,很可能会有更多的邮件。因为有的退订是虚假的。这是一种善意的广告邮件,如果你不需要可以删掉它。第四个是服务系统所有者和服务运营商它不是垃圾邮件的责任人,你去找谁呢?只要有人去用这个垃圾邮件,立法在惩罚的时候,惩罚邮局还是惩罚这个人呢?如果惩罚邮局的话,这个邮局很无辜的。由于垃圾邮件的制造者跨地域跨国界很强,我们看到很多的案件,虽然有媒体的支持,但是扩展还是很慢的。如果用垃圾邮件去联系国际的关系,我觉得是没有用的。

  如果可以解决垃圾邮件的话,我保证你一定会获得诺贝尔奖。我们第一个问题条件讨论了如何应对垃圾邮件的问题。就是ip人员需要对你的用户进行相应的培训,告诉他什么是垃圾邮件,怎么分解,怎么使用这个技术来更好的区分。再一个就是如何更好的区分解决识别垃圾邮件。受到我们看一下垃圾邮件的策略,从5.5来看几乎是没有对垃圾邮件的防范措施的。我们惊喜的发现微软公司在垃圾邮件中做了很多的努力。这样对我们垃圾邮件的系统来说是一个非常好的过滤。因为我们看到垃圾邮件中很大的是退出的邮件。那么接到一封邮件包含的内容要想,它是从哪里来的?谁发来的?发给谁的?谈论什么?我们可以通过连接的筛选,对单位ip或ip段进行组织。第二种我们可以订阅一些第三方的rbl服务,支持使用多个rbl服务,支持使用多个rbl无,每个rbl支持自定义的ndr,允许例外列表,整合iis的ip特性。谁发来的发信人筛选方面,主要从特定的地址或域法虽的邮件,筛选发信人唯恐的邮件,可选择满足条件时断开连接,可限制仅经过验证的用户才可以发邮件,解析匿名发信人。发给谁的?收件人也要坚决筛选。筛选不在目录中的收件人,不发送ndr、直接拒绝,问题:地址薄窥探,筛选发送给特定邮件人的邮件,限制给邮件列表(组)发送邮件,我们经常在企业中会遇到邮件列表,也就是邮件组,我们发给全部员工一个邮件,叫组。可这个组有问题,我们在企业里面很多人喜欢传一些小笑话,比如说拉登又出现的这样的小笑话,它会发送给这个组,所以全部都能收到一份。这样很麻烦,所以我们可以限制组的权限。第三个就是最难的东西,叫内容的筛选,我们知道前面的收件人都是一个比较固定的东西,内容比较麻烦,因为内容比较多,我们接受的内容有八百兆,很多,地址很短,那么这个时候微软公司有一个智能邮件的组件,这个产品在hotmail上用的邮件组。它把内容做一个平分,得到一个级别。一表示有百分之十的可能发送邮件,一直到99.99%的发送邮件的方式。可以设置仅经过验证的用户可发送,防止他人向邮件组发送垃圾邮件。当然这个系统是一个知识系统,所以它不需要用户过多的干预,所以它在用户的界定上的东西很少,所以你可以通过检查去找到这个正确的指标。也可以通过spk研发去降低这个指标。服务的2003和outlook的录用就可以控制拉间邮件。谈论什么?也是通过内容的筛选,imf,一个相同的内容分间程序,支持第三方整合,应用了微软研究院的先进分析技术,该技术已在hotmail大规模部署过,使用邮件的scl属性,标记邮件是垃圾邮件的可能性,支持sdk开发。

  sender id如何工作呢?发件人在dns中公布外发邮件的服务器的ip地址,接受的exchange server判定发件人所在域,接受邮件的exchange server检查发件人所在的dns,看是否有sender id记录,如果sender id记录在案,接收方的服务器比对记录中的列表检查对方ip。还有一些其他的反垃圾邮件技术,比如outlook 2003子组织下载外部邮件内容,用户自定义的安全/组织收件人信息,较高的安全性,组织邮件中的脚本执行,组织邮件信标的触发,第三方产品的专业支持,反向域名查找,smtp会话阶段的检查。为什么看到垃圾邮件就是直接删除,不要看。因为它有信标的,它能力知道你看到了,而且看的人是谁,下回它会发给你更多的垃圾邮件。而outlook 2003它就不显示这些垃圾邮件了。

  最后我们总结一下,然后给大家做一个小的演示。我们知道垃圾邮件是世界性的难题,协议本身的缺陷绝对着垃圾邮件很难消亡,垃圾邮件防范不仅仅是管理员的工作,很重要一点就是用户不要去发垃圾邮件,这是最好的一个控制方法。一个法律的针对性是有范围的,法不责众就是这样一个道理。虽然在网关级我们需要,在邮件级我们需要,但是在客户端我们也是必须需要的。因为用户要帮助和优化这个系统。垃圾邮件防范需要广大用户的大力参与和反馈,客户端垃圾邮件防范系统是必不可少的,微软一直致力于垃圾邮件的防范技术的发展和使用,让我们一起努力,还邮件一个洁净的天空。我们演讲就到这里。下面有一个简单的演示。