证据理论（Dempster-Shafer 理论）

第六五签

于 2024-09-27 00:23:10 发布

阅读量579

点赞数 8

分类专栏：数学文章标签：概率论

本文链接：https://blog.csdn.net/weixin_39699362/article/details/142580891

版权

数学专栏收录该内容

26 篇文章 2 订阅

订阅专栏

基本概念

一、定义

证据理论也被称为 Dempster-Shafer 理论，是一种不精确推理理论，主要用于处理不确定信息。它允许人们在证据不完全、不精确或相互矛盾的情况下进行推理和决策。

二、基本概念

识别框架：
- 识别框架是一个非空有限集合，表示所有可能的假设或命题的集合。用符号 $\Theta$ 表示。
- 例如，对于一个疾病诊断问题，识别框架可以是 $\Theta=\{ 疾病 A,疾病 B,疾病 C\}$ 。
基本概率分配函数（BPA）：
- 基本概率分配函数用符号 $m$ 表示，它将一个数值分配给识别框架 $\Theta$ 的幂集 $2^{\Theta}$ 中的每个子集。
- $m$ 的取值范围是从 $0$ 到 $1$ ，并且满足 $m(\varnothing)=0$ ， $\sum_{A\subseteq\Theta}m(A)=1$ 。
- 例如，对于识别框架 $\Theta=\{ 疾病 A,疾病 B,疾病 C\}$ ， $m(\{疾病 A\})=0.3$ ， $m(\{疾病 B\})=0.4$ ， $m(\{疾病 C\})=0.2$ ， $m(\{疾病 A,疾病 B\})=0.1$ 等。
信任函数（Belief Function）：
- 信任函数用符号 $B e l$ 表示，它是基于基本概率分配函数定义的。对于任意子集 $A\subseteq\Theta$ ，信任函数 $Bel(A)=\sum_{B\subseteq A}m(B)$ 。
- 信任函数表示对子集 $A$ 的信任程度的下限。
- 例如，对于上述例子， $Bel(\{疾病 A\})=m(\{疾病 A\})=0.3$ ， $Bel(\{疾病 A,疾病 B\})=m(\{疾病 A\})+m(\{疾病 B\})+m(\{疾病 A,疾病 B\})=0.3 + 0.4 + 0.1 = 0.8$ 。
似然函数（Plausibility Function）：
- 似然函数用符号 $Pl$ 表示，对于任意子集 $A\subseteq\Theta$ ，似然函数 $Pl(A)=1-Bel(\overline{A})$ ，其中 $\overline{A}$ 是 $A$ 的补集。
- 似然函数表示对子集 $A$ 的信任程度的上限。
- 例如，对于上述例子， $Pl(\{疾病 A\})=1-Bel(\{疾病 B,疾病 C\})=1-(m(\{疾病 B\})+m(\{疾病 C\})+m(\{疾病 B,疾病 C\}))=1-(0.4 + 0.2 + 0)=0.7$ 。

三、证据合成规则

Dempster 合成规则：
- 当有多个独立的证据源时，可以使用 Dempster 合成规则将它们合并起来。
- 设 $m_1$ 和 $m_2$ 是两个基本概率分配函数，合成后的基本概率分配函数 $m=m_1\oplus m_2$ ，对于任意非空子集 $A\subseteq\Theta$ ， $m(A)=\frac{1}{1-K}\sum_{B\cap C=A}m_1(B)m_2(C)$ ，其中 $K=\sum_{B\cap C=\varnothing}m_1(B)m_2(C)$ ， $K$ 表示两个证据之间的冲突程度。
- 如果 $K\neq1$ ，则合成是可行的；如果 $K = 1$ ，则表示两个证据完全冲突，无法进行合成。

四、应用领域

信息融合：证据理论在多传感器信息融合中得到了广泛应用，可以将来自不同传感器的信息进行融合，提高决策的准确性。
风险评估：用于评估各种风险因素，确定风险的可能性和影响程度。
决策分析：帮助决策者在不确定的情况下做出合理的决策。
模式识别：处理模式识别中的不确定性问题。

五、优缺点

优点：
- 能够处理不确定和不精确的信息，比传统的概率理论更灵活。
- 可以表示证据之间的冲突和不确定性程度。
- 提供了信任函数和似然函数，分别表示信任程度的下限和上限，为决策提供了更多的信息。
缺点：
- 计算复杂度较高，尤其是在处理大规模问题时。
- 对证据的独立性要求较高，实际应用中很难满足完全独立的条件。
- 合成规则可能会导致一些不合理的结果，例如在证据冲突较大时。

示例

一、问题背景

假设有一个医疗诊断的场景，医生需要根据患者的症状来判断患者可能患有的疾病。识别框架为 $\Theta=\{疾病 A,疾病 B,疾病 C\}$ 。

二、证据来源及基本概率分配函数

第一个证据源来自患者的症状表现，给出的基本概率分配函数 $m_1$ 如下：
- $m_1(\{疾病 A\})=0.3$ ，表示根据这个证据源，认为患者患有疾病 A 的可能性为 0.3。
- $m_1(\{疾病 B\})=0.4$ ，认为患者患有疾病 B 的可能性为 0.4。
- $m_1(\{疾病 C\})=0.2$ ，认为患者患有疾病 C 的可能性为 0.2。
- $m_1(\{疾病 A,疾病 B\})=0.1$ ，表示患者同时患有疾病 A 和疾病 B 的可能性为 0.1。
第二个证据源来自实验室检测结果，给出的基本概率分配函数 $m_2$ 如下：
- $m_2(\{疾病 A\})=0.2$ 。
- $m_2(\{疾病 B\})=0.3$ 。
- $m_2(\{疾病 C\})=0.4$ 。
- $m_2(\{疾病 A,疾病 C\})=0.1$ 。

三、证据合成

首先计算冲突系数 $K$ ： - $K=\sum_{B\cap C=\varnothing}m_1(B)m_2(C)$ 。
- 分别计算不同子集的乘积并求和：
  - $m_1(\{疾病 A\})m_2(\{疾病 B\})=0.3\times0.3 = 0.09$ 。
  - $m_1(\{疾病 A\})m_2(\{疾病 C\})=0.3\times0.4 = 0.12$ 。
  - $m_1(\{疾病 B\})m_2(\{疾病 A\})=0.4\times0.2 = 0.08$ 。
  - $m_1(\{疾病 B\})m_2(\{疾病 C\})=0.4\times0.4 = 0.16$ 。
  - $m_1(\{疾病 C\})m_2(\{疾病 A\})=0.2\times0.2 = 0.04$ 。
  - $m_1(\{疾病 C\})m_2(\{疾病 B\})=0.2\times0.3 = 0.06$ 。
- $K = 0.09 + 0.12 + 0.08 + 0.16 + 0.04 + 0.06 = 0.55$ 。
然后进行证据合成：
- 对于子集 ${疾病 A\}$ ：
  - $m(\{疾病 A\})=\frac{1}{1 - K}\sum_{B\cap C=\{疾病 A\}}m_1(B)m_2(C)$ 。
  - 这里只有 $m_1(\{疾病 A\})m_2(\{疾病 A\})=0.3\times0.2 = 0.06$ 和 $m_1(\{疾病 A,疾病 B\})m_2(\{疾病 A,疾病 C\})=0.1\times0.1=0.01$ 两项对结果有贡献。
  - $m(\{疾病 A\})=\frac{1}{1 - 0.55}\times(0.06 + 0.01)=\frac{0.07}{0.45}\approx0.1556$ 。
- 对于子集 ${疾病 B\}$ ：
  - 同理可得 $m(\{疾病 B\})=\frac{1}{0.45}\times(m_1(\{疾病 B\})m_2(\{疾病 B\})+m_1(\{疾病 A,疾病 B\})m_2(\{疾病 A,疾病 B\}))$ 。
  - 经计算 $m(\{疾病 B\})\approx0.2311$ 。
- 对于子集 ${疾病 C\}$ ：
  - $m(\{疾病 C\})=\frac{1}{0.45}\times(m_1(\{疾病 C\})m_2(\{疾病 C\})+m_1(\{疾病 A,疾病 C\})m_2(\{疾病 A,疾病 C\})+m_1(\{疾病 B,疾病 C\})m_2(\{疾病 B,疾病 C\}))$ 。
  - 经计算 $m(\{疾病 C\})\approx0.3111$ 。
- 对于子集 ${疾病 A,疾病 B\}$ ：
  - $m(\{疾病 A,疾病 B\})=\frac{1}{0.45}\times(m_1(\{疾病 A\})m_2(\{疾病 A,疾病 B\})+m_1(\{疾病 A,疾病 B\})m_2(\{疾病 A\}))$ 。
  - 经计算 $m(\{疾病 A,疾病 B\})\approx0.0889$ 。
- 对于子集 ${疾病 A,疾病 C\}$ ：
  - $m(\{疾病 A,疾病 C\})=\frac{1}{0.45}\times(m_1(\{疾病 A\})m_2(\{疾病 A,疾病 C\})+m_1(\{疾病 A,疾病 C\})m_2(\{疾病 A\}))$ 。
  - 经计算 $m(\{疾病 A,疾病 C\})\approx0.0556$ 。
- 对于子集 ${疾病 B,疾病 C\}$ ：
  - $m(\{疾病 B,疾病 C\})=\frac{1}{0.45}\times(m_1(\{疾病 B\})m_2(\{疾病 B,疾病 C\})+m_1(\{疾病 B,疾病 C\})m_2(\{疾病 B\}))$ 。
  - 经计算 $m(\{疾病 B,疾病 C\})\approx0.1089$ 。

四、结果分析

信任函数：
- $Bel(\{疾病 A\})=m(\{疾病 A\})=0.1556$ 。
- $Bel(\{疾病 B\})=m(\{疾病 B\})=0.2311$ 。
- $Bel(\{疾病 C\})=m(\{疾病 C\})=0.3111$ 。
似然函数：
- $Pl(\{疾病 A\})=1 - Bel(\{疾病 B,疾病 C\})=1-(m(\{疾病 B\})+m(\{疾病 C\})+m(\{疾病 B,疾病 C\}))\approx1-(0.2311 + 0.3111 + 0.1089)=0.3489$ 。
- $Pl(\{疾病 B\})=1 - Bel(\{疾病 A,疾病 C\})=1-(m(\{疾病 A\})+m(\{疾病 C\})+m(\{疾病 A,疾病 C\}))\approx1-(0.1556 + 0.3111 + 0.0556)=0.4777$ 。
- $Pl(\{疾病 C\})=1 - Bel(\{疾病 A,疾病 B\})=1-(m(\{疾病 A\})+m(\{疾病 B\})+m(\{疾病 A,疾病 B\}))\approx1-(0.1556 + 0.2311 + 0.0889)=0.5244$ 。