1 introduction
马尔科夫逻辑网络是将马尔科夫网络与一阶逻辑相结合的一种全新的统计关系学习模型,在自然语言处理、复杂网络、信息抽取等领域都有重要的应用前景。本文将简单的介绍马尔科夫逻辑网络的理论模型,对后续学习马尔科夫逻辑网络的推理和学习做一些铺垫。
在如何有效的处理复杂性和不确定性问题的研究中,国内外学者近年来先后提出了统计关系学习(Statistical Relational Learning, SRL)[2, 3, 4]和概率图模型(Probabilistic Graphical Model, PGM)[5, 6]等重要方法,并引起了极大关注。简单地说,统计关系学习通过集成关系/逻辑表示、概率推理、不确定性处理、机器学习和数据挖掘等方法,以获取关系数据中的似然模型。目前,关系/逻辑表示仍以一阶谓词逻辑为主,用以紧凑表达领域知识和有效处理逻辑问题;而概率图模型则是一种通用化的不确定性知识表示和处理方法,主要涵盖了贝叶斯网络(Bayesian Networks, BNs)、隐马尔科夫模型(HiddenMarkov Model, HMM)、马尔科夫决策过程(Markov Decision Process,MDP)、神经网络(Neural Network, NN)等。一个很自然的想法是将统计关系学习(尤其是关系/逻辑表示)和概率图模型进行综合集成。2004年美国华盛顿大学的Richardson和Domingos[2]首次提出了马尔科夫逻辑网络(Markov Logic Networks, MLNs,以下简称Markov逻辑网),并论证了Markov逻辑网作为统计关系学习的统一框架的可能性[2]。其主要理由如下:一方面,从概率统计的角度来看,Markov逻辑网不仅为简洁明了地描述庞大的Markov网(Markov Networks, MNs)提供了一种紧凑有效的手段,而且它还能够灵活地在Markov网中融入模块化知识域的能力;另一方面,从一阶谓词逻辑的角度来看,Markov逻辑网给一阶谓词逻辑加入了出色的不确定性处理能力,并且能够容忍知识域中存在的不完整性和矛盾性等问题。因此,统计关系学习中的许多重要工作(如聚合分类、关系预测、社会网络及目标识别等)都可统一到Markov逻辑网的体系中来。鉴此,当前国际人工智能界普遍公认Markov逻辑网是一种较完美地结合一阶谓词逻辑和概率图模型的复杂性和不确定性问题表示和处理方法,具有十分重要的研究价值和广阔的应用前景,已成为人工智能、机器学习、数据挖掘等领域的研究热点。
2 Markov Logic Network
2.1 Markov netwrk和一阶逻辑
Markov网[7]也称Markov随机场(MarkovRandom Field, MRF)[5],是一组变量集合X=(X1,X2,…Xn)∈x的联合分布模型。它由一个无向图G和定义于G上的一组势函数组成。其中,无向图的每个节点都代表一个随机变量,而G中的每一个“团”(Clique)都对应着一个势函数(为非负实函数),表示团的一个状态。Markov网所代表的变量集的联合分布表示为: