ASP.NET 反垃圾邮件管理系统的设计与实现(论文+源码)_Nueve

摘  要

随着Internet的迅速普及,电子邮件以其快捷、方便、低成本的特点逐渐成为人们进行信息交流的主要媒介之一,但是随之而来的垃圾邮件也越来越泛滥。垃圾邮件占用了有限的存储、计算和网络资源,耗费了用户大量的处理时间,影响和干扰了用户的正常工作、生活和学习。如何有效地治理垃圾邮件是全世界共同面临的一道难题,也是互连网上目前有待解决的问题。本文首先介绍了电子邮件对人们日常生活的重要性,然后概要介绍了反垃圾邮件技术的发展历史。研究了三种过滤垃圾邮件的方法,分别是黑白名单技术、主题关键字过滤技术和贝叶斯策略,对这三种技术的设计方法做了说明,重点介绍了贝叶斯过滤技术的设计原理和实现步骤。最后总结了这几种过滤技术的不足之处和设计中遇到的难点问题。

关键词电子邮件;垃圾邮件;黑白名单;主题关键字;贝叶斯

Design of anti-spam mail management system based on ASP

Abstract

With the rapid development of internet, the technology of email is used widely in people's daily life. However, the occurrence of more and more spam emails is annoying to user, which causes the great waste of user's time, money as well as network bandwidth. And what's worst, it can be harmful to users. It affects and interferes with the user's normal work, life and studying. How to deal with spam emails effectively, that is a common difficult problem for all over the world. In the current Internet it is a problem for waiting for us to resolve. At first this paper introduces the e-mail's importance for people's daily life. Then it introduces simply development history of the anti-spam technology and researches three of spam filtering methods, they are black and white list technology, subject keyword filtering technology and bayesian strategy. Then the designing methods of three kinds of technology are introduced. Focusing on the bayesian filtering technology, this paper introduces its designing principle and implementation's steps. Finally I sums up some shortcomings of several kinds of filtering technology and some difficult problems in designing.

Key words: email; spam email; black and white list; subject keyword; bayesian

目  录

1 引言

1.1 课题背景

1.2 开发概述

1.2.1电子邮件概述

1.2.2反垃圾概述

2 电子邮件的工作原理

2.1 电子邮件的结构

2.2 电子邮件的传输

3 需求分析

3.1 数据库需求分析

3.2 开发环境需求

4 系统功能和技术描述

4.1 系统功能模块设计

4.2基本功能

4.3黑白名单技术

4.4 关键字过滤技术

4.5 贝叶斯过滤技术

4.5.1贝叶斯过滤算法的基本步骤

4.5.2贝叶斯过滤算法举例

4.5.3贝叶斯过滤模块划分

5 系统工作流程和详细设计

5.1 系统工作流程图

5.2邮件统计设计

5.3收件夹设计

5.4反垃圾功能设计

5.4.1黑白名单过滤

5.4.2主题关键字过滤

5.4.3贝叶斯过滤

5.4.4过滤参数设置

6 测试与分析

6.1系统测试

6.2设计中的难点问题

6.3三种过滤技术分析

6.4通用模块分析

结    论

参考文献

致    谢

声    明

1引言

1.1 课题背景

随着Internet的极度膨胀,给人们带来了大量的信息,电子邮件使人们感受到快捷和方便,更已成为一种最快速经济的通信手段,但是互联网又是一个无政府世界,有些人利用电子邮件肆意散发邮件广告,造成很多人的邮箱垃圾成堆,有些人利用电子邮箱制造邮件炸弹,使电子邮件服务器瘫痪;更有甚者利用电子邮件来传播病毒。如此种种给许多用户带来了无尽的困扰。因此对垃圾邮件进行有效的过滤,已经成为了一个有重要意义的现实问题。目前,我国对垃圾邮件过滤研究中语义分析和文本分类方面的技术还比较落后,导致国内很多大型的电子邮件系统无法及时有效地发现和拒绝垃圾邮件,从而给用户造成巨大的伤害。更为严重的是国外很多垃圾邮件制造者利用这一缺陷,通过中国的邮件服务器发送垃圾邮件,致使很多国外ISP服务提供商封锁了中国邮件服务器的IP地址,给中国用户造成很多精神和经济损失。随着中国经济与世界经济的关系日益紧密,中外交流活动的逐渐增多,对外的电子邮件数量也急剧增加,如果中国电子邮件由于垃圾邮件问题遭到全面封杀,必将会对国内企业和组织造成巨大影响,严重组碍中国经济的发展。因此,对新的,可靠的垃圾邮件过滤技术的研究已经成为一项紧迫任务。

1.2 开发概述

1.2.1电子邮件概述

电子邮件表示通过电子通讯系统进行信件的书写、发送和接收。今天使用的最多的通讯系统是互联网,同时电子邮件也是互联网上最受欢迎的功能之一。通过电子邮件系统,您可以用非常低廉的价格,以非常快速的方式(几秒钟之内可以发送到世界上任何你指定的目的地),与世界上任何一个角落的网络用户联络。同时,您可以得到大量免费的新闻、专题邮件,并实现轻松的信息搜索。这是任何传统的方式也无法相比的。正是由于电子邮件的使用简易、投递迅速、收费低廉,易于保存、全球畅通无阻,使得电子邮件被广泛地应用,它使人们的交流方式得到了极大的改变。每一个申请互联网帐号的用户都会有一个电子邮件地址。它是一个很类似于用户家门牌号码的邮箱地址,或者更准确地说,相当于你在邮局租用了一个信箱。因为传统的信件是由邮递员送到你的家门口,而电子邮件则需要自己去查看信箱,只是您不用跨出家门一步。电子邮件来源于专有电子邮件系统。早在互联网流行以前很久,电子邮件就已经存在了,是在主机-多终端的主从式体系中从一台计算机终端向另一计算机终端传送文本信息的相对简单的方法而发展起来的。

经历了漫长的过程之后,它现在已经演变成为一个更加复杂并丰富得多的系统,可以传送声音、图片、图像、文档等多媒体信息,以至于如数据库或帐目报告等更加专业化的文件都可以以电子邮件附件的形式在网上分发。

1.2.2反垃圾概述

 “垃圾邮件”多指未经请求而发送的电子邮件,也可以是发送给与信件主题不相关的新闻组或者列表服务器的同一信件的重复邮件。国内外的技术专家和反垃圾邮件组织对“垃圾邮件”的定义如出一辙:批量发送的未征得收信人同意的电子邮件。 这些电子邮件虽然每封的信息量不一定很大,但是邮件内容不是大多数用户需要甚至是令大多数用户讨厌的。铺天盖地的宣传邮件不仅侵犯了用户的私人空间,而且干扰了大多数用户正常使用电子邮件功能,同时给用户带来了上网时间和上网资金上的浪费,因此被称为“垃圾邮件”。国际互联网上的常见名词SPAM、UCE(Unsolicited Commercial Email不请自来的商业电子邮件)和UBE(Unsolicited Bulk Email不请自来的批量电子邮件)与通常所称的垃圾邮件是一样的。反垃圾邮件技术的研究是一项长期而艰巨的任务,经历了以下几个时代:

表1-1 反垃圾邮件的历史

第一代

第二代

第三代

第四代

基础MTA控制

实时黑名单

贝叶斯过滤

多技术整和分层过滤

白名单和黑名单

电子签名

人工智能

简单的关键字搜索

机器语言学习

信件头测试

标题过滤

简单的DNS测试

当前的反垃圾邮件技术可以分为4大类:过滤器(Filter)、反向查询(Reverse lookup)、挑战(challenges)和密码术(cryptography),这些解决办法都可以减少垃圾邮件问题,但是都有它们的局限性。其中过滤又包括关键词过滤、黑白名单、HASH技术、基于规则的过滤、智能和概率系统、贝叶斯算法,验证查询技术分为反向查询技术、DKIM技术、SenderID技术、FairUCE技术,挑战分为挑战-响应、计算性挑战。

2电子邮件的工作原理

2.1 电子邮件的结构

电子邮件可视为半结构化的文本文件。RFC822 明确的把邮件划分为两部分:第1 部分称为邮件头,邮件头中包含若干数据字段,其作用是标识邮件的重要部分,例如发送者、接收者、主题和注释。邮件头字段应出现在邮件体之前,两部分间使用一个空行分隔。第2 部分就是邮件体(body),邮件体(body)是发送用户发给接收用户邮件的内容。

2.2 电子邮件的传输

电子邮件与普通信件有类似的地方,发信者注明收件人的姓名与地址(即邮件地址),发送方服务器把邮件传到收件方服务器,收件方服务器再把邮件发到收件人的邮箱中,如下图所示:

图2-1 高层SMTP接口模型

电子邮件系统主要由以下3 部分组成:MUA (Mail UserAgent),邮件用户代理,是帮助用户读和写邮件;MTA (MailTransport Agent),邮件传输代理,负责将邮件从一个服务器传到另一个服务器;MDA(MailDeliveryAgent),邮件投递代理,将邮件分发到用户的邮箱里。整个邮件传输过程如下图所示:

图2-2 邮件传输中的代理

3需求分析

3.1 数据库需求分析

该系统采用Microsoft SQL Server 2000数据库,数据库的名称mail。对系统功能的分析绘制了系统总体E-R图,如图3-1所示:

图3-1 系统E-R图

4系统功能和技术描述

4.1 系统功能模块设计

本系统分为三个大模块,每个大模块下有不同的功能划分,模块结构图如图4-1所示:

图4-1 系统功能模块结构图

图5-2 邮件统计

图5-4 邮件内容查看

图5-7 白名单添加

图5-9 主题关键字设置

如果您在计算机领域有任何疑虑或不确定的地方,请毫不犹豫地与老师交流噢,我们期待着为您提供有针对性的建议和指导。您的问题和讨论对我们来说都非常重要。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值