中国电子邮件应用协调中心垃圾邮件特征库接口细则

原创 2001年10月28日 19:58:00

  为方便广大邮件系统服务商和电子邮件相关软件的开发者,CNEAC提供了完全无偿使用的技术接口,通过这个接口,为用户提供实时的垃圾邮件和危险服务器的名单。

  技术接口可以通过http的方式取得,分两个系统

  一、SPAM黑名单

  接口URL: http://www.cneac.org/support/spamdata.asp

  返回格式:每条记录一行,行与行之间用回车符(ASCII 13)隔开,每条记录中的字段之间用TAB符(ASCII 9)隔开,字段依次是:spam_id、mailfrom、mailsubject、infotype,每个字段的含义如下:

  spam_id..........该条记录的唯一ID
  mailfrom.........垃圾邮件来源(发信人地址)
  mailsubject......垃圾邮件标题关键字
  infotype.........该条记录的性质(增加记录-A,删除对应的记录-D)

  其中mailfrom和mailsubject两个字段是“and”的关系,但是如果其中如果有一个是空的话,则忽略,例如:

  mailfrom=123@sina.com
  mailsubject=how are you

  则说明这条记录对应的SPAM邮件是发信人是123@sina.com的,且标题包含"how are you"这个字符串的。

  如果:

  mailfrom=123@sina.com且mailsubject为空的话,则说明所有发信人为123@sina.com的信件均为垃圾邮件,反之如果mailfrom为空的话,则所有主题包含mailsubject的信件均为垃圾邮件。

  可选参数:

  lastid.......起始spam_id,设定这个参数后,则只返回spam_id大于lastid的记录。
  count........返回的记录数上限

  如请求url为:http://www.cneac.org/support/spamdata.asp?lastid=90

  则表明要返回spam_id大于90的SPAM名单记录

  如果没有指定参数,则默认返回所有的记录,建议调用者根据实际情况,在本地存储上次更新最后一个spam_id,再次更新的时候指定lastid,以避免下载旧的记录。

  二、危险邮件服务器黑名单

  危险邮件服务器指的是没有对发信方采取控制、认证措施的SMTP服务器,这类服务器极容易被垃圾邮件制造者利用,危险服务器黑名单的规则与SPAM名单的规则类似,见下:

  接口URL: http://www.cneac.org/support/serverdata.asp

  返回格式:每条记录一行,行与行之间用回车符(ASCII 13)隔开,每条记录中的字段之间用TAB符(ASCII 9)隔开,字段依次是:badserver_id、badserver、infotype,每个字段的含义如下:

  badserver_id.....该条记录的唯一ID
  badserver........危险服务器IP地址,多地址之间用分号(ASCII 59)分隔
  infotype.........该条记录的性质(增加记录-A,删除对应的记录-D)

  可选参数:

  lastid.......起始badserver_id,设定这个参数后,则只返回badserver_id大于lastid的记录。
  count........返回的记录数上限

  如果没有指定参数,则默认返回所有的记录,建议调用者根据实际情况,在本地存储上次更新最后一个badserver_id,再次更新的时候指定lastid,以避免下载旧的记录。

  如请求url为:http://www.cneac.org/support/serverdata.asp?lastid=90

  则表明要返回badserver_id大于90的危险服务器名单记录

  开发者必须遵守的约定

  1、必须根据infotype来操作记录的增加或删除,如果当前记录的infotype为D,则必须从本地系统的数据库中删除对应的记录。如为spam数据,则应该删除mailfrom和mailsubject的对应记录,如果为危险服务器数据,则应该删除badserver的对应记录。

  2、如果你是软件开发者,应该除通过网络自动调用接口更新外,为用户预留通过符合这一标准的文本文件来进行离线更新的接口。网络应用程序开发者也应酌情考虑到这个问题。

  3、使用CNEAC接口的软件、网络应用系统等,必须在显著位置注明“由CNEAC提供垃圾邮件或危险服务器名单”,并加入本站的连接。

  4、建议使用CNEAC接口的开发者订阅CNEAC的邮件列表,以便能够及时得到我们的信息。

数据挖掘在垃圾邮件过滤中的应用

 数据挖掘在垃圾邮件过滤中的应用李强 071221054(南京大学计算机科学与技术07级  江苏省 南京市 210000) Application of data miningin Spam filt...
  • l21871035
  • l21871035
  • 2009年10月21日 13:34
  • 3629

中国第一封电子邮件是谁发出的?

  9月19日 “跨越长城,我们可以到达世界的任何角落。”这是1987年9月20日从北京向海外发出的中国第一封电子邮件。这也预示着,互联网时代悄然叩响了中国的大门。  20年前发出这封邮件的是德国的维...
  • Iamfish
  • Iamfish
  • 2007年12月15日 00:15
  • 1204

Python3:《机器学习实战》之朴素贝叶斯(3)过滤垃圾邮件

Python3:《机器学习实战》之朴素贝叶斯(3)过滤垃圾邮件 转载请注明作者和出处:http://blog.csdn.net/u011475210 代码地址:https://github.com/W...
  • u011475210
  • u011475210
  • 2017年09月10日 21:56
  • 3845

贝叶斯推断应用:垃圾邮件过滤

附上新博客地址:月光森林引入仍然是“信息内容安全” 课程的一个实验总结。为了理解整个原理,不但重新复习了一边贝叶斯,还因为对“联合概率”理解不透彻,直接翻译了一篇文章 —— 联合概率(翻译)。特此对整...
  • ArrowLLL
  • ArrowLLL
  • 2017年04月06日 18:47
  • 633

自己动手打造企业垃圾邮件过滤系统

电子邮件是整个互联网业务重要的组成部分。据相关报道统计,四分之三以上的用户上网的主要目的是收发邮件,每天有十数亿封电子邮件在全球传递,其应用频率已经超过了WWW服务,因此,电子邮件已成为网络用户不可或...
  • WYHuan1030
  • WYHuan1030
  • 2011年01月11日 19:31
  • 5129

[机器学习实战]--朴素贝叶斯过滤垃圾邮件

我们将充分利用python的文本处理能力将文档切分成词向量,然后利用词向量对文档进行分类。还将构造分类器观察其在真实的垃圾邮件数据集中的过滤效果。基于贝叶斯决策理论的分类方法假设现在我们有一个数据集,...
  • sherlockzoom
  • sherlockzoom
  • 2015年08月29日 16:52
  • 880

Gmail是怎么判断垃圾邮件

Gmail收件箱里混入垃圾邮件的概率也很低,Gmail是靠什么判断的呢?
  • helihongzhizhuo
  • helihongzhizhuo
  • 2014年11月17日 17:31
  • 1113

【机器学习实战二:朴素贝叶斯算法之过滤垃圾邮件】

一、部分说明 ---------------------------------------------------------------- 1、本文代码是《机器学习实战》这本书的例程。点击下载《机...
  • u013634684
  • u013634684
  • 2015年11月05日 22:35
  • 2616

你想收到中国向世界发出的第一封电子邮件吗

在值得纪念的30周年之际,你是否想收到30年前从中国发出的第一封电子邮件的原文?和我们谈一场关于情怀的恋爱? 如果你愿意,点击http://t.cn/Rp0pMYS 收取来自1987年的邮件!赶快参...
  • SendCloud
  • SendCloud
  • 2017年09月13日 18:11
  • 633

贝叶斯公式的理解及应用(垃圾邮件过滤)

全概公式 贝叶斯公式 贝叶斯推断 过滤垃圾邮件 条件概率
  • vivian_ll
  • vivian_ll
  • 2017年03月10日 16:23
  • 1425
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:中国电子邮件应用协调中心垃圾邮件特征库接口细则
举报原因:
原因补充:

(最多只允许输入30个字)