Discrete Mathematics and Its applications - 离散数学及其应用 读书笔记 ( 二 )

《 Discrete 》书中关于 Bayesian Spam Filter 的应用, 中文可以翻译为 “基于贝叶斯理论的垃圾邮件过滤器”

先是一个简单的例子,基于单个单词的删选词,原文有个例子:

Suppose that we have found that the word “Rolex” occurs in 250 of 2000 messages known to be spam and in 5 of 1000 messages known not to be spam. Estimate the probability that an incoming message containing the work “Rolex” is spam, assuming that it is equally likely that an incoming message is spam or not spam. If our threshold for rejecting a message as spam is 0.9, will we reject such messages?

大意就是,已知: “ Rolex ” 这个单词在已经标为 spam 的 2000 封邮件中, 总共出现了 250 次; 在标为不是 spam 的 1000 封邮件中, 共出现了 5 次。 假设一封邮件是不是 spam 邮件是平等来看待的,也就是 各占 12 的概率,那么如果有一封邮件中出现了 Rolex 这个单词, 这封邮件是 spam 的概率是多少? 如果我们设定超过 0.9 的概率就要拒收,那么我们对这类邮件是不是要拒收?

思路是这样的:
1) 假设 S 是邮件是 Spam 的事件, 那么 S¯ 就代表不是 spam 的事件;
2) 假设 E 是邮件里出现 Rolex 的事件, 那么 E¯ 就代表不出现 Rolex 的事件;
3) Rolex 在整个 2000 封已经被标为 spam 的邮件中共出现概率是 p(w)=nB(w)/|B| , 在整个 1000 封已经被标为不是 spam 邮件中共出现的概率是 q(w)=nG(w)/|G| ; B 代表是 spam 邮件的集合总体, G 代表是非 spam 邮件的集合总体;
4) 假设一封邮件既有可能是 spam , 也有可能不是 spam, 各占 50% 的概率
5) 为了方便解释, 只设置一个单词来判定是不是 spam.

目的是求解: P( S|E)

P(S|E)=P(SE)P(E)=P(ES)P(E)=P(E|S)P(S)P(E|S)P(S)+P(E|S¯)P(S¯)=P(E|S)0.5P(E|S)0.5+P(E|S¯)0.5=P(E|S)P(E|S)+P(E|S¯)=25020002502000+510000.962

所以求解公式最终也可以演化为:

P(S|E)=r(w)=p(w)p(w)+q(w)

当然只用一个单词来判断邮件是不是 spam 未免有失偏颇,下面推到有两个单词来判定结果:

P(S|E1E2)=P(S(E1E2))P(E1E2)=P(E1E2|S)P(S)P(E1E2|S)P(S)+P(E1E2|S¯)P(S¯)=P(E1EU2|S)P(E1E2)|S)+P(E1E2|S¯)=p(w1)p(w2)q(w1)q(w2)+p(w1)p(w2)

由此可以推导出多个单词来判断 spam 的公式:

p(S|i=1kEi)=ki=1p(Ei|S)ki=1p(Ei|S)+ki=1p(Ei|S¯)

用 spam 邮件和非 spam 邮件出现的词频来计算这个公式:

r(w1,w2..wk)=ki=1p(wi)ki=1p(wi)+ki=1q(wi)

### 回答1: 离散数学及其应用是一门研究离散结构和离散对象的数学学科,它在计算机科学、信息科学、通信工程、运筹学等领域有着广泛的应用。离散数学的研究内容包括图论、集合论、逻辑、代数、组合数学等。它的应用范围涉及到计算机算法、网络通信、密码学、人工智能等多个领域。 ### 回答2: 离散数学是研究离散结构和离散对象的数学分支,其应用广泛且重要。它主要关注离散的而非连续的数学结构,如集合、函数、图论、逻辑和代数等。离散数学通常用于计算机科学、信息科学和数学物理学中。 离散数学的应用十分广泛。首先,在计算机科学中,离散数学是构建和分析算法的基础。算法设计者需要使用离散数学的原理来解决问题,如确定性有限自动机、图算法、排列组合和概率等。 其次,在信息科学中,离散数学被用于密码学和信息安全领域。离散数学可以描述和分析密码系统的强度和安全性,如差分隐私、扩散和置换等。 此外,离散数学还有很多实际应用。例如,在网络和通信领域,离散数学被用于分析和设计通信协议和网络拓扑。在运筹学和优化领域,离散数学被用于解决资源规划、调度和最优化等问题。在知识工程和人工智能领域,离散数学被用于知识表示、推理和机器学习等。 总而言之,离散数学是一个十分重要且有广泛应用的数学分支。它的理论和方法对许多领域的问题都具有重要意义,不仅为解决实际问题提供了数学工具,也为学术研究提供了理论基础。 ### 回答3: 离散数学是研究离散结构和离散量的数学分支,是数学的一个重要分支领域。它的应用广泛,涉及计算机科学、信息技术、运筹学、计算数学、密码学等多个学科。 在计算机科学中,离散数学是计算机科学的基础。离散数学为计算机科学提供了算法分析、复杂度理论和数据结构等重要的数学工具。例如,图论是离散数学的一个重要分支,它为计算机网络、编译原理和并行计算等领域提供了理论基础。另外,离散数学还为计算机科学中的逻辑、离散数论、离散概率论以及随机过程等提供了数学证明和分析方法。 在信息技术领域,离散数学被广泛应用于密码学和信息安全中。离散数学中的组合数学、数论以及有限域理论等内容,为密码学提供了重要的工具和方法。离散数学的一些概念,如置换、排列组合、哈希函数和RSA算法等,被广泛应用于数据加密和信息安全领域。 此外,离散数学还在运筹学、计算数学和图像处理等领域发挥着重要作用。运筹学是研究最优化问题的学科,其中很多问题可以归结为离散优化问题。离散数学提供了图论、网络流、线性规划等数学工具来解决这些问题。同时,在计算数学中,离散数学为数值计算和算法分析提供了基础。在图像处理中,离散数学中的排列、矩阵理论和变换等概念被广泛应用于图像的表示、压缩和处理等算法。 总的来说,离散数学及其应用领域众多,离散数学的理论和方法为计算机科学、信息技术、运筹学、计算数学和图像处理等领域提供了重要的工具和思维方式。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

dbLenis

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值