基于评分的因果发现算法研究1

最新推荐文章于 2024-05-19 10:35:46 发布

邢昱

最新推荐文章于 2024-05-19 10:35:46 发布

阅读量1.9k

点赞数

文章标签：算法机器学习 python

本文链接：https://blog.csdn.net/qq_39535112/article/details/120107276

版权

基于评分搜索的结构学习

根据评分选择最佳网络，为每一个网络赋一个评分（通过后验概率、贝叶斯信息准则BIC（Bayesian Information Criterion）、赤池信息准则AIC（Akaike Information Criterion）。）
搜索最佳评分的有向无环图，常用贪心法等启发式搜索方法。如典型的贪婪等价搜索算法（greedy equivance search，GES）。给定数据集 $D = \{ {D_1},{D_2},{D_3},...,{D_N}\}$
在搜索空间中找到一个结构 G*使得： ${G^{\rm{*}}}{\rm{ = arg}}\mathop {{\rm{max}}}\limits_{G \in {G_n}} score(G)$
其中Gn为变量集 $V = \{ {X_1},{X_2},{X_3},...,{X_n}\}$
在DAGs搜索空间中的所有可能结构。
基于评分搜索的结构学习把所有可能的结构视为定义域，衡量特定结构好坏的标准视为评分函数，将寻找最好结构的过程看成在定义域求最优的评分函数。

即在算法上，确定合适的评分函数的结构搜索策略，
结构搜索主要分为父集识别和结构优化两个步骤。
当前研究重点为结构优化部分，包括最近的基于神经网络的结构优化，也是对结构优化方法进行创新。
流程图如下图所示：
在这里插入图片描述

评分函数

评分函数分为两类：分别是贝叶斯评分函数，基于信息论的评分函数。
最广泛的评分函数为BDeu和BIC，但BDeu等传统的评分算法只能应用于完整的离散变量。
评分函数具有***分数可分解性***的重要属性：DAG的分数由每个变量Xi与其父集 ${\Pi _i}$ 得到分数的总和构成，即 $\sum\limits_{{X_i}} {score({X_i},{\Pi _i},D)}$
其中G为网络拓扑结构；P(G)为其先验概率；D为数据集。