SpamAssassin 3.2.x 配置文档中文版 01
2010-04-06 18:14

SpamAssassin 3.2.x 配置文档中文版

source :
http://anti-spam.org.cn/forums/topic/7040-spamassassin-32x-aaaeoeaiaeuuoedhiaeae/
http://anti-spam.org.cn/upload/file/Mail_SpamAssassin_Conf_3_2.zip

英文官方原版 :
http://spamassassin.apache.org/full/3.2.x/doc/Mail_SpamAssassin_Conf.html



* 名称
* 修订与译者注
* 格式
* 描述
* 文件格式
* 使用者参考
o 评分选项
o 白名单和黑名单选项
o 基本消息标记选项
o 语言选项
o 网络测试选项
o 学习选项
o 其它选项
* 规则定义与特权设置
* 管理员设置
* 预处理选项
* 模板标记
o 正常字串/垃圾字串标记格式
* 本地化
* 参见

名称

Mail::SpamAssassin::Conf - SpamAssassin 配置指南

英文版原地址 -

http://spamassassin.apache.org/full/3.2.x/doc/Mail_SpamAssassin_Conf.html

修订与译者注

* 2004/11/13 第一次发布,适用于 SpamAssassin 3.0.x 版本
* 2007/11/5 更新至 SpamAssassin 3.2.x 版本,并修改了大量用语

中文版翻译 - 中国反垃圾邮件联盟 (http://anti-spam.org.cn) 王兴宇

如果译文中有任何错误,欢迎给我发邮件指出,不胜感激。如果希望讨论 SpamAssassin 的相关内容,请到中国反垃圾邮件联盟论坛的 SpamAssassin 版讨论。

译文版本 - 2.0 (最后更新日期:2007/11/27)

名词注释:

邮件服务器和中继服务器

* 邮件服务器,即 MX (Mail Exchange),是域或主机的 MX 记录所指向的主机,从功能上来说,邮件服务器(MX)是指接收从其它使用 SMTP 协议发过来邮件的主机。
* 中继服务器,即 Relay,是指用来从上游接收邮件,然后将其发送到下游的主机。

通常,邮件服务器(MX)和中继服务器是同一个主机,并使用同一个 IP 地址,但是经常也会有分别处于不同主机和 IP 的情况。

本文中,个别情况下,邮件服务器也统称这两种情况,请依据上下文语义判断。
正常邮件和垃圾邮件

* 正常邮件,即 ham ,是指被认定为非垃圾邮件的电子邮件。
* 垃圾邮件,即 spam ,是指被认定为垃圾邮件的电子邮件。

格式

# 注释文本

rewrite_header Subject          *****SPAM*****

full PARA_A_2_C_OF_1618         /Paragraph .a.{0,10}2.{0,10}C. of S. 1618/i
describe PARA_A_2_C_OF_1618     Claims compliance with senate bill 1618(根据上议院第1618号法令)

header FROM_HAS_MIXED_NUMS      From =~ /\d+[a-z]+\d+\S*@/i
describe FROM_HAS_MIXED_NUMS    From: contains numbers mixed in with letters(From: 信头中混和了数字)

score A_HREF_TO_REMOVE          2.0

lang es describe FROM_FORGED_HOTMAIL Forzado From: simula ser de hotmail.com(西班牙语:“信件假称其来自Hotmail.com”)

lang pt_BR report O programa detetor de Spam ZOE [...] ( 波兰语: 检测到了垃圾邮件)

描述

SpamAssassin 使用传统的UNIX风格的配置文件,并从 /usr/share/spamassassin 和 /etc/mail/spamassassin 目录中读取这些配置文件。

以下地址列出了 SpamAssassin 配置中最重要的选项,建议初次使用者首先阅读:

http://wiki.apache.org/spamassassin/ImportantInitialConfigItems

文件格式

以 # 开始的一行是注释。注意:如果 # 字符用于规则或配置选项中,必须使用斜线转义,即:\#

文件中的空白字符是无所谓的,但是最好不要放在行首,因为将来可能使用行首空白来表示续行。

不过在当前,每个规则或配置必须放在一行,多行仍然不被支持。

文件和目录的路径中能使用 ~ 字符来表示用户的主目录,但是不支持其它的 shell 风格的路径扩展,如通配符或 ~user/。

以下在适当的情况下,默认值会被列在括号中。

使用者参考

以下选项能被用于站点级配置(local.cf)和用户级配置(user_prefs)中,通过它们可以定制 SpamAssassin 处理进入的邮件的方式。

评分选项

required_score n.nn (默认值: 5)
设定一个邮件被判定为垃圾邮件的分数线。n.nn 可以是整数或者实数。 默认值为5.0,这是很严厉的设置了,它适用于单个用户使用;但是对于应用于整个服务器,应该设置得更保守一些(更高一些),比如设置为8.0或10.0 等等。通常不推荐设置为自动删除或丢弃那些被判定为垃圾邮件的邮件,否则可能招致用户的强烈抗议;除非评分特别的高,比如15.0或者更高,才可以考虑直接删除。这个选项以前称之为 required_hits ,现在虽然还可以用,但是不推荐使用旧的名称。

score 测试规则名 n.nn [ n.nn n.nn n.nn ]
指定一个测试规则的评分(命中后的评分)。评分可以是正的或者负的整数或实数。测试规则名是一个测试规则的名称,如: FROM_ENDS_IN_NUMS 。


如果只列出了一个评分,那么测试后总是返回该评分。

如果列出了4个评分,那么 SpamAssassin 在不同的使用情况下返回不同的评分。第一个评分用于贝叶斯测试和网络测试都被取消的情况下(0号评分集);第二个评分用于贝叶斯测试被取消,但使用网络测试的情况下(1号评分集);第三个评分用于使用贝叶斯测试,但网络测试被取消的情况下(2号评分集);第四个评分用于贝叶斯测试和网络测试都使用的情况下(3号评分集)。

设置一个测试规则的评分为0会取消该规则的测试。

如果评分使用括号“()”括起来,那么该行所有其后的评分都被增加同等的比例。例如,“(3)”表示在所有的评分集中提高该评分3点。“(3) (0) (3) (0)”表示只提高0号和2号评分集3点评分。

如果一个测试规则没有给定评分,它将会被指定一个默认评分1.0;除非是以“T_”开头的测试规则(用于指出该测试规则还在试验中),它会被指定为评分0.01。

注意,以“__”开头的测试规则名是一个间接规则,它被用于组成元匹配规则和作为其它规则的前置测试,这些规则不会被计算评分也不会列在“命中的测试”报告中。注意,虽然间接规则的评分不会被计算,但是设置间接规则的评分为0会取消该规则的测试。

白名单和黑名单选项

whitelist_from 邮件地址
它用于指定通常被误判为发送的垃圾邮件的发信地址。

并不推荐使用这个选项,垃圾邮件或钓鱼邮件的发送者非常简单的就可以制造一些让它盲目信任的邮件。推荐的解决方法是使用 whitelist_auth 或其它认证的白名单方式替代,或使用 whitelist_from_rcvd。

白名单和黑名单都可以使用通配符。如 friend@somewhere.com 、 *@isp.com 或 *.domain.net 都是可以的。需要注意的是只支持 * 和 ? (匹配单个字符),但是不支持其他的元字符匹配。由于一些安全的原因,这里也不支持正则表达式。

可以在一行中使用空格分隔开写入多个邮件地址,也可以使用多个 whitelist_from 行来指定。

信头的白名单检查按照如下顺序:如果信头设置了 Resent-From 地址,那么就检查它;否则检查来自下列信头的全部地址:

Envelope-Sender
Resent-Sender
X-Envelope-From
From

此外,如果SMTP通讯中的信封信息可用的话,那么“信封发件人(envelope sender)”也会被检查。参见 envelope_sender_header 。

范例:

whitelist_from joe@example.com fred@example.com
whitelist_from *@example.com

unwhitelist_from 邮件地址
它用于覆盖一个默认的 whitelist_from 选项。举例说,在 local.cf 中指定了一个站点级通用的白名单地址 whitelist_from ,用户可以在他的 user_prefs 中可以使用这个选项来覆盖那个通用的白名单地址选项。这个选项所匹配的邮件地址也必须同样被前面的 whitelist_from 选项所匹配。

范例:

unwhitelist_from joe@example.com fred@example.com
unwhitelist_from *@example.com

whitelist_from_rcvd 邮件列表地址 中继服务器的反向解析名
它是对 whitelist_from 的补充,用来对“Received”信头进行检查。 第一个参数是一个白名单的地址,第二个参数用于匹配该邮件的中继服务器的反向DNS解析名称。

第二个参数用于在邮件从互联网发送到你的内部网的邮件服务器(MX)时进行的反向DNS查询匹配。它可以是一个完全限定的主机名或主机名的域部分,换言之,如果连接到你的邮件服务器(MX)的主机的IP可以被反向解析为“sendinghost.spamassassin.org”,那么你可以写为 sendinghost.spamassassin.org 或 spamassassin.org 。

注意,这需要你的 internal_networks 被正确配置。简言之,除非在一个复杂的网络里,设置这个参数可以得到不错的效果。

同时,也要求你的邮件服务器(MX)可以对连接进来的服务器的IP地址进行反向查询,且将查询结果记录在“Recevied”信头中。

范例:

whitelist_from_rcvd joe@example.com  example.com
whitelist_from_rcvd *@axkit.org      sergeant.org

def_whitelist_from_rcvd 邮件列表地址 中继服务器的反向解析名
类似于 whitelist_from_rcvd,但是它用于在 SpamAssassin 发行包中指定默认白名单。这个白名单的评分较低,它常常是垃圾邮件发送者假称的地址。

whitelist_allows_relays 邮件地址
指定 whitelist_from_rcvd 中的哪些邮件地址可以不使用 white_from_rcvd 中对应的邮件中继发信,而使用其它的中继服务器发信。默认情况下,发信地址在 white_from_rcvd 中,但是中继服务器却不是列出的那个,这种情形会触发一个测试伪造的规则。将该地址放入到 white_allows_relay 中防止触发。

白名单和黑名单都可以使用通配符。如 friend@somewhere.com , *@isp.com ,或 *.domain.net 都是可以的。需要注意的是只支持 * 和 ? (匹配单个字符),不支持其他的元字符匹配。由于安全的原因,这里不支持正则表达式。

可以在一行中使用空格分隔写入多个邮件地址,也可以使用多个 whitelist_allows_relays 行来指定。

这里列出的邮件地址不必被前面的 whitelist_from_rcvd 所完全匹配,它只需要匹配信头中的地址就行。

范例:

whitelist_allows_relays joe@example.com fred@example.com
whitelist_allows_relays *@example.com

unwhitelist_from_rcvd 邮件地址
它用于覆盖 whitelist_from_rcvd 选项。举例说, SpamAssassin 发行包中的默认 whitelist_from_rcvd 能够被 local.cf 中的这个选项覆盖,或者用户也可以在他的 user_prefs 中使用这个选项来覆盖 whitelist_from_rcvd 。

所匹配的地址也必须同样被前面的 whitelist_from_rcvd 选项所匹配。

范例:

unwhitelist_from_rcvd joe@example.com fred@example.com
unwhitelist_from_rcvd *@axkit.org

blacklist_from 邮件地址
它用于指定那些通常被漏判为正常邮件的垃圾邮件发送地址。格式与 whitelist_from 相同。

unblacklist_from 邮件地址
它用于覆盖 blacklist_from 选项。举例说, SpamAssassin 发行包中的默认 blacklist_from 能够被 local.cf 中的这个选项覆盖,或者用户也可以在他的 user_prefs 中使用这个选项来覆盖 blacklist_from 。

所匹配的地址也必须同样被前面的 blacklist_from 选项所匹配。

范例:

unblacklist_from joe@example.com fred@example.com
unblacklist_from *@spammer.com

whitelist_to 邮件地址
如果给定的地址出现在信头中的收信人那里(Resent-To, To, Cc, 明显的信封收件人等),邮件将作为正常邮件处理。 它常用于整个站点使用了 SpamAssassin 但是某些用户不希望他们的任何邮件被过滤。与 whitelist_from 的格式相同。

有三个级别的接收白名单:whitelist_to 、 more_spam_to 和 all_spam_to 。 在第一个接收白名单中的用户仍然可能会被过滤一些垃圾邮件,但是在 all_spam_to 的用户不会被过滤任何垃圾邮件。

白名单信头检查将按照如下顺序,如果设置了 Resent-To 或 Resent-Cc 就使用它们;否则检查来自下列信头中的全部地址:

To
Cc
Apparently-To
Delivered-To
Envelope-Recipients
Apparently-Resent-To
X-Envelope-To
Envelope-To
X-Delivered-To
X-Original-To
X-Rcpt-To
X-Real-To

more_spam_to 邮件地址
参见上面。

all_spam_to 邮件地址
参见上面。

blacklist_to 邮件地址
如果给定的地址出现在信头的收件人中(Resent-To, To, Cc, 明显的信封收件人等),邮件将被作为垃圾邮件处理。与 blacklist_from 的格式相同。

whitelist_auth 邮件地址
它用于指定通常被误判为发送的垃圾邮件的发信地址。与 whitelist_from 和 whitelist_from_rcvd 不同的是,在监测白名单前会首先会检查邮件是否是授权的发信人。

授权检查是通过安装的发信人授权检查模块之一进行的: SPF (使用 Mail::SpamAssassin::Plugins::SPF)、 Domain Keys (使用 Mail::SpamAssassin::Plugins::DomainKeys) 或 DKIM (使用 Mail::SpamAssassin::Plugins::DKIM)。注意,使用这个选项前这些插件必须激活并可以正常工作。

使用 whitelist_auth 基本上等同于使用 whitelist_from_spf 、 whitelist_from_dk 和 whitelist_from_dkim 来指定每个发信地址。

范例:

whitelist_auth joe@example.com fred@example.com
whitelist_auth *@example.com

def_whitelist_auth 邮件地址
类似于 whitelist_auth ,但是它用于在 SpamAssassin 发行包中指定默认白名单。这个白名单的评分较低,它常常是垃圾邮件发送者假称的地址。

unwhitelist_auth 邮件地址
用于覆盖 whitelist_auth 项。所匹配的地址也必须同样被前面的 whitelist_auth 选项所匹配。

范例:

unwhitelist_auth joe@example.com fred@example.com
unwhitelist_auth *@example.com

基本消息标记选项

rewrite_header { subject | from | to } 标记字符串
默认情况下,SpamAssassin 不会对那些被判定为垃圾邮件的信件主题、发信人和收信人等信息进行修改,以标识其是垃圾邮件。如果设置了这个选项,信件主题、发信人和收信人会被加上特定的字符串来表明该邮件是垃圾邮件。对于发信人和收信人的修改是在地址后面增加一个括在括号里面的RFC 2822格式的注释;对于信件主题的修改则是在原先的主题前添加。注意,在 report_safe 设置为0时,你只能使用 _REQD_ 和 _SCORE_ 标记来重写信件主题,否则你也许不能通过正常的方式去掉 SpamAssassin 的标记。关于标记的更多信息可以参见下面的模板标记部分。

在重写发信人和收信人时,字符串不能包含圆括号(会被转换为方括号)。

如果使用 rewrite_header subject ,但是被重写的邮件没有包含 Subject 信头,会自动添加一个 Subject 信头。

如果标记字符串指定为空,任何已有的重写将从信头里去掉。

add_header { spam | ham | all } 信头名 字符串
可以对各种类型的信件(垃圾邮件、正常邮件和全部邮件)增加 SpamAssassin 的定制信头。所有的定制信头都会以 X-Spam- 开始(如信头 Foo 将显示为 X-Spam-Foo )。信头只能使用下列字符:所有的大小写英文字符、所有的数字和下划线及中划线。([A-Za-z0-9_-])。

字符串中可以包含下面描述的模板标记。如果需要的话,还可以使用\n和\t来增加回车符和制表符。使用\\来表示一个反斜线字符。其它的转义字符无效,只被简单的去掉反斜线。

如果 fold_headers 被设置为1,所有的信头会被折叠起来(即通过行首空格进行续行,以避免较长的行)。但是注意,通过\n手工换行的信头将不会被自动折叠(即可能会出现很长的信头),即使这个信头需要折叠起来。

你能够通过 add_header 来定制已有的信头(仅指定要修改的信件子集)。

清除全部的定制信头请参见 clear_headers 。

以下是一些例子(这些是默认增加的,注意 Checker-Version 不能修改或删除):

add_header spam Flag _YESNOCAPS_
add_header all Status _YESNO_, score=_SCORE_ required=_REQD_ tests=_TESTS_ autolearn=_AUTOLEARN_ version=_VERSION_
add_header all Level _STARS(*)_
add_header all Checker-Version SpamAssassin _VERSION_ (_SUBVERSION_) on _HOSTNAME_

remove_header { spam | ham | all } 信头名
可以删除各种类型的信件(垃圾邮件、正常邮件和全部邮件)中的 SpamAssassin 的定制信头,这些信头是以 X-Spam- 开头的(所以这里指定信头名时应该前缀以 X-Spam- )。

清除全部的定制信头请参见 clear_headers 。

注意,X-Spam-Checker-Version 信头是不能删除的,因为邮件管理员和开发人员需要使用它来诊断问题。如果没有这个信头,甚至都不知道 SpamAssassin 是否在运行。

clear_headers
清空全部的 SpamAssassin 定制信头。你可以在任何的 add_header 前使用这个,以防止默认的 SpamAssassin 信头被添加到信头中。

注意,X-Spam-Checker-Version 信头是不能被删除的,因为邮件管理员和开发人员需要使用它来诊断问题。如果没有这个信头,甚至都不知道 SpamAssassin 是否运行。

report_safe ( 0 | 1 | 2 ) (默认值: 1)
如果这个选项被设置为1,当收到的信件被判定为垃圾邮件时,不修改原信件,而是创建一个新的报告信件,并且将原信件作为一个RFC 822格式的附件附上(确保原信件保持原样,不直接打开,且容易恢复)。

如果这个选项被设置为2,原信件以文本方式附加到报告信件中。之所以采用这个选项是由于安全的原因,某些不完善的邮件客户端会在用户没有要求的情况下自动的载入附件,这可能会带来一些安全问题。这个选项也许会导致附加的信件和原信件保存出来或看起来并不太一样。

如果这个选项设置为0,收到的垃圾邮件只在信头中增加一些 X-Spam- 信头而不修改信体。此外,X-Spam-Report 信头会被增加到垃圾邮件中,你可以设置 report_safe 为0后使用 remove_header 来去掉这些 SpamAssassin 的定制信头。

如果你要复制原信件的信头到被判定的邮件中,参见 report_safe_copy_headers 。

语言选项

ok_locales xx [ yy zz ... ] (默认值: all)
这个选项指定了那些地区性(国家代码)的邮件被认为是正常邮件。使用这些国家的语言字符集的邮件不会被标记为外文垃圾邮件。

如果你收到了很多外文的垃圾邮件,而且绝不会收到用这种语言写的正常邮件,这个选项也许会有帮助。注意,所有的ISO-8859-*字符集和 Windows代码页字符集默认总是允许的。

设置为all可以允许所有的字符集。这是默认值。

这个选项的设置决定了规则 CHARSET_FARAWAY、CHARSET_FARAWAY_BODY 和 CHARSET_FARAWAY_HEADERS 的触发条件。

范例:

ok_locales all         (允许全部地s)
ok_locales en          (仅允许英文)
ok_locales en ja zh    (仅允许英文、中文和日文)

注意,如果指定了多个 ok_locales 行则只有最后一个有效。

可用的地区如下:

en - 西方通用字符集
ja - 日语字符串
ko - 韩语字符集
ru - 斯拉夫与字符集
th - 泰语字符集
zh - 中文(包括简体和繁体)字符集

normalize_charset ( 0 | 1) (默认值: 0)
是否检测字符集并转换邮件内容为 Unicode。需要有 Encode::Detect 模块、 HTML::Parser 3.46 及其以上版本,且 Perl 5.8.5 及其以上版本。

网络测试选项

trusted_networks 网络地址[/掩码] ... (默认值:无)
这个选项设置可信任的网络或主机(可信网络或可信主机)。可信任是指这些网络上的中继服务器确信不会被垃圾邮件发送者所操纵、也不会是开放转发(open relay)和开放代理(open proxy)。一个可信主机能够毫无顾忌的转发垃圾邮件而不会被识别,甚至不需要伪造信头。SpamAssassin 甚至也不会在 DNS黑名单中查询可信网络中的主机。

参见 http://wiki.apache.org/spamassassin/TrustPath 获取更多信息。

在你的域中的邮件服务器和内部中继服务器应使用 internal_networks 指定。当有除了你的邮件服务器和内部中继服务器外的可信主机时,应该仅在 trusted_networks 指定它们。

如果指定了一个 / 及其后的掩码,这是一个CIDR风格的网络地址;如果没有指定掩码,但是有少于4个的IP地址单元并后缀以一个点的话,它是指所有前面的 IP地址单元相同的网络地址;如果没有指定掩码也没有后缀的点,它是指一个单一IP地址,就像指定了/32掩码一样。

如果在网络或主机地址前前缀 ! ,表示该地址被排除(或包括)在第一个匹配中。

注意:与你的配置无关,127/8 总是包括在可信网络中。

范例:

trusted_networks 192.168/16            # 全部的 192.168.*.*
trusted_networks 212.17.35.15          # 仅指该地址
trusted_networks !10.0.1.5 10.0.1/24   # 全部的 10.0.1.*,但是除了 10.0.1.5

trusted_networks 的定义是叠加的,多个选项指定的可信网络都会作为可信网络。可以使用 clear_trusted_networks 清除前面定义的可信网络。

如果没有设置这个选项,但是设置了 internal_networks ,那么 internal_networks 的值将作为这个选项的默认值。

如果既没有配置 trusted_networks ,也没有配置 internal_networks ,SpamAssassin 会自行分析判断,流程如下:

* 如果“from”主机位于私有保留网段(RFC 1918),那么它是可信的

* 如果在 received 信头中有认证串,且前一个主机是可信任的,那么这个主机也是可信任的。

* 否则,这个主机及其之后的主机都被认为是不可信任的。

clear_trusted_networks
清空前面定义的可信网络列表。

internal_networks 网络地址[/掩码] ... (默认值: 无)
这个选项设置内部网络或主机。内部是指在该网络的中继服务器是你的域中的邮件服务器或内部中继服务器。它的格式同上面的 trusted_networks 一样。

该选项用于在检查拨号或动态IP地址黑名单时,用来检测“单跳发送(direct-to-MX)”的垃圾邮件。

可信任的中继服务器会直接从拨号连接接受邮件而不需要它们列在 internal_networks 中,它们只需列在 trusted_networks 中。

如果设置了 trusted_networks 而没有设置 internal_networks,那么 trusted_networks 的值将作为这个选项的默认值。

如果既没有指定 trusted_networks 也没有指定 internal_networks ,即没有本地地址。换言之,任何连接到运行 SpamAssassin 的主机的主机都被认为是外部的。

internal_networks 中的地址都会出现在 trusted_networks 中,换言之, internal_networks 总是可信主机的一个子集。

注意:与你的配置无关,127/8 总是包括在可信网络中。

clear_internal_networks
清空前面定义的内部网络列表。

msa_networks 网络地址[/掩码] ... (默认值: 无)
这个选项设置 MSA 网络或主机。MSA 指位于这些网络的中继服务器会接受来自认证用户的邮件。这些中继服务器不会接受认证未通过的主机的邮件。认证方式如 IP 地址列表、SMTP 发信认证和POP-before-SMTP等。

所有邮件信头中列在 MSA 之后的中继服务器都将同 MSA 一样被看做 trusted_networks 和 internal_networks 中定义的可信网络和内部网络。

举例说,如果 MSA 是可信的和内部的,那么之前的所有中继服务器也应该都是可信的和内部的。

当用 msa_networks 来标识一个 MSA 时,建议也将其放入到可信网络和内部网络中。当一个 MSA 没有被包括在 msa_networks 中时,你应该将其放入可信网络而不是内部网络。无论如何,如果一个 MSA 也作为邮件服务器(MX)或中继服务器时,你总应该将其放入可信网络和内部网络内,并确保 MSA 在 Received 信头中包含认证标识来识别合法的客户。

警告:当一个 MSA 同时也作为邮件服务器(MX)或中继服务器或接受非认证用户邮件时,绝不要将其加入到 msa_networks 中。这样做结果是未知的外部中继也将被视作可信网络。

clear_msa_networks
清空前面定义的 MSA 网络列表。

always_trust_envelope_sender ( 0 | 1 ) (默认值: 0)
如果邮件通过了一个或多个可信中继服务器,信任其信封发件人。参见 envelope_sender_header 。

skip_rbl_checks ( 0 | 1 ) (默认值: 0)
默认情况下 SpamAssassin 会做 RBL 查询。如果你的 ISP 已经做过了这个检查,可以设置为1跳过再次检查。

dns_available { yes | test[: 名字1 名字2...] | no } (默认值: test)
默认情况下, SpamAssassin 会查询一些默认主机以判断 DNS 是否工作正常。做这个测试的原因是有可能因为网络链接断开导致的延时和某些情况下由于连接失败导致的 DNS 不可用。SpamAssassin 默认包括了13个测试的服务器,并且每次随机取出其中3个测试。

你可以指定你自己的测试列表:

dns_available test: domain1.tld domain2.tld domain3.tld

注意,DNS检查的是NS记录。

SpamAssassin 的网络规则测试是并发进行的。这也许会导致需要打开的文件描述符超过了系统限制,安全起见推荐将文件描述符的限制至少增加到256以上。

dns_test_interval n (默认值: 600 秒)
如果 dns_available 设置为 'test' (默认),SpamAssassin 将在 dns_test_interval 秒后重新测试 DNS 是否工作。

学习选项

use_bayes ( 0 | 1 ) (默认值: 1)
是否使用 SpamAssassin 内建的朴素贝叶斯(Bayes)风格的分类器。这是SpamAssassin 里所有的贝叶斯相关的选项的主开关。

use_bayes_rules ( 0 | 1 ) (默认值: 1)
是否使用 SpamAssassin 内建的朴素贝叶斯风格的分类器规则。这个选项允许你打开自动学习和手动学习的情况下禁止使用贝叶斯规则。

bayes_auto_learn ( 0 | 1 ) (默认值: 1)
设置 SpamAssassin 是否自动通过高评分邮件(或低评分邮件,用于正常邮件)的“学习”提高系统识别能力。目前“学习”只支持朴素贝叶斯风格的分类器。

关于贝叶斯自动学习默认实现的细节,参见 Mail::SpamAssassin::Plugin::AutoLearnThreshold 插件模块的文档。

bayes_ignore_header 信头名
如果你收到的邮件被上游邮件系统过滤过,比如ISP的邮件过滤或邮件列表的过滤,且这些过滤增加了新的信头(多数如此),这些信头可能会给贝叶斯分类器一些不正确的指示。为了避免这种情况,可以使用这个选项列出这些信头:如:

bayes_ignore_header X-Upstream-Spamfilter
bayes_ignore_header X-Upstream-SomethingElse

bayes_ignore_from 邮件地址
贝叶斯分类器和自动学习功能不会处理来自这里列出地址的邮件。如果 sa-learn 使用 --use-ignores 选项的话,也会忽略这些邮件。可以列出一个或多个地址,格式参见 whitelist_from 。

来自特定发件人的垃圾邮件也许包含了许多经常出现在正常邮件中的词汇。举个例子,某个人也许会收到他常光顾的书店发来的邮件,但是不希望收到来自其他书店的类似邮件。如果那些不想收到的信件作为垃圾邮件被学习的话,那么任何讨论书籍的邮件,包括来自他想收到的那个书店发来的邮件也很可能被判定为垃圾邮件。这些让人讨厌的书店的邮件地址应该列在这里。(他们无视你的许可,并且不发任何邮件就将你加入了他们的会员。)

那些发送许可的垃圾邮件的人,或收到了包含了垃圾邮件中常见词汇的正常邮件的人,可能会担心一些垃圾邮件被作为正常邮件处理。那些发送垃圾邮件的邮件列表和地址等可以放到这个列表中。

bayes_ignore_to 邮件地址
贝叶斯分类器和自动学习功能不会处理发送到这里列出地址的邮件。参见 bayes_ignore_from 。

bayes_min_ham_num (默认值: 200)
bayes_min_spam_num (默认值: 200)
为确保正确,贝叶斯分类器在一定数量的垃圾邮件和正常邮件被学习之前不会被启用。他们的默认值是200,你可以针对需要调高或降低这两个数值。

bayes_learn_during_report (默认值: 1)
贝叶斯系统默认情况下会学习那些被分析并报告为垃圾邮件的邮件( spamassassin -r )。你可以设置这个选项为0来关闭学习功能。

bayes_sql_override_username
用于 BayesStore::SQL 存储。

如果设置了这个选项, BayesStore::SQL 模块所设置的 username 将被覆盖。这个选项用于实现一个全局或分组的贝叶斯数据库。

bayes_use_hapaxes (默认值: 1)
指定贝叶斯分类器是否使用 hapaxes (仅仅出现了一次的词汇/字串)。它能提高命中率但是会增大数据库的大小到8到10倍。

bayes_journal_max_size (默认值: 102400)
SpamAssassin 将不定时的同步日志和数据库。通常是一天做一次同步,但是如果日志文件大小超过了这个选项所设置的值,将会同步更多次。该值的单位是字节。如果该值设置为 0,不定时同步就不再进行。

bayes_expiry_max_db_size (默认值: 150000)
指定了贝叶斯字串数据库的最大的大小。当达到了最大的大小时,贝叶斯系统将视乎大小,保留原来的75%或10万个字串。一般15万个字串的数据库会占用8M的空间。

bayes_auto_expire (默认值: 1)
如果设置为1,贝叶斯系统将自动丢弃旧的字串。仅在数据库中的字串数量超过了 bayes_expiry_max_db_size 时才会自动丢弃旧的字串。

bayes_learn_to_journal (默认值: 0)
如果设置了这个选项,那么 SpamAssassin 在学习的时候会将结果写入到日志而不是直接写入到数据库中。降低了更新时对数据库的锁定情况的发生,但是也导致了对日志文件的更多读写和数据库更新的延迟。

其它选项

lock_method 方式
选择一个文件锁定方式来保护磁盘上的数据库文件。默认情况下,在UNIX上 SpamAssassin 会使用“NFS安全”锁定方式;不过,如果你确认你用于贝叶斯和自动白名单的数据库决不会通过NFS方式来访问,你可以“非NFS安全”的锁定方式。

这会相对快一些,但是如果同时有一个或多个通过NFS方式访问的客户端访问时,可能会造成数据库文件的破坏。

注意,不同的操作系统使用不同的锁定方式。

支持下列锁定方式:

nfssafe - “NFS安全”的锁定方式
flock - 简单的 UNIX flock() 锁定方式
win32 - Win32 平台上使用 sysopen (..., O_CREAT|O_EXCL)锁定方式

nfssafe 和 flock 只能用于 UNIX 上,win32 只能用于 Windows 。默认情况下,SpamAssassin 根据操作系统的不同使用 nfssafe 或 win32 锁定方式。
fold_headers ( 0 | 1 ) (默认值: 1)
默认情况下,SpamAssassin 添加的信头会使用行首空白进行折叠。换言之,它们将会断成多行而不是使用一个很长的行,其后的行添加前置的制表符来表示对前一行的续行。

可以通过这个选项来禁止自动折叠,不过要注意可能会生成很长的行。

report_safe_copy_headers 信头名 ...
如果使用 report_safe,一些原邮件的信头被复制到封装邮件的信头里面(From, To, Cc, Subject, Date 等)。如果你希望其他的信头也被复制到这里,你可以使用这个选项。你可以在一行里面使用空格分隔开列出多个信头,或者使用多个此选项。

envelope_sender_header 信头名
如果SMTP服务器提供了“MAIL FROM:”通讯信息(信封发信人),SpamAssassin 会试图从邮件中发现该信息。这个选项用于指定信封发信人这个“伪信头”,这个“伪信头”可用于各种检查,比如SPF等。

默认情况下,几种MTA使用不同的信头,如:

X-Envelope-From
Envelope-Sender
X-Sender
Return-Path

如果可以通过查找一些特征(比如邮件的信头,或 fetchmail 的特征等)可以安全的确定这些,那么 SpamAssassin 会使用它们。 然而,某些邮件服务器的配置可能会导致选择了错误的信头。(更多的讨论请参见 SpamAssassin 的 BugZilla 里面的2142号和4747号错误。)

为了避免选择错误,可以使用 envelope_sender_header 来指明这个信头。这个信头包含的是你的 MTA 在 SMTP 对话过程中 MAIL FROM 命令里的邮件地址。

如果信头像在SMTP通讯中一样在右边的邮件地址两端包含了“ < ”或“ > ”字符,这两个字符将被去掉。

如果该信头没有找到或者信头中没有包含“ @ ”符号, SpamAssassin 将在日志中记录一个警告,并采用其默认方式来来确定信封发信人。

(给 MTA 开发者的提示,我们希望将来使用一个单独的与其后的垃圾邮件扫描器不同的信头。http://wiki.apache.org/spamassassin/EnvelopeSenderInReceived 提出了一个更好建议,使用 Received 信头在每一跳中记录信封发信人)

范例:

envelope_sender_header X-SA-Exim-Mail-From

describe 测试规则名 描述 ...
用于描述一个测试规则。这个描述会出现在用户看到的细节报告中。

注意,以“__”开始的测试是为元规则所保留,它们不会被计分和列出在“命中的测试”报告中。

同时注意,习惯上描述文本不要超过50个字符。

report_charset 字符集 (默认值: 未设置)
设置附加了垃圾邮件原信件的报告邮件( text/plain 格式)的 MIME Content-Type 的字符集。

report 报告模板
设置附加了文本(text/plain)的垃圾邮件的报告邮件的报告模板,参见 /usr/share/spamassassin 中的 10_misc.cf 中的例子。

如果你设置了这个,请不要超过每行78个字符。每个 report 行累加到已有的模板定义上(前面的 report 行),可以使用 clear_report_template 来清除前面的模板定义。

能够使用上述的特定标记。

clear_report_template
清除前面定义的 report 模板。

report_contact 联系地址
设置上面报告中使用的 _CONTACTADDRESS_ 的值。默认值是“the administrator of that system”,后跟上运行本软件的系统的主机名。

report_hostname 使用的主机名
设置上面报告中使用的 _HOSTNAME_ 的值。默认情况下是 SpamAssassin 动态检测到的运行本软件的主机名。

unsafe_report 报告模板
设置附加了包含非文本(text/plain)部分的垃圾邮件的报告邮件的报告模板,参见 /usr/share/spamassassin 中的 10_misc.cf 中的例子。

每个 unsafe-report 行累加到已有的模板定义上(前面的 unsafe_report 行),可以使用 clear_unsafe_report_template 来清除前面的模板定义。

能够使用上述的特定标记。

clear_unsafe_report_template
清除 unsafe_report 模板。
 

http://hi.baidu.com/shengit/blog/item/dab082025ba2e1e008fa93f8.html