知识图谱与基本概念
基本概念
规则学习定义:从训练数据中学习出一组能用于对未见示例进行判别的规则。
规则定义:规则一般是:语义明确、能描述数据分布所隐含的客观规律或领域概念。
逻辑规则定义:⊕←?1⋀?2⋀?3…⋀??⊕←f_1⋀f_2⋀f_3…⋀f_L
右侧为规则体:由L个逻辑文字组成的合取式。
左侧为规则头:逻辑文字组成的目标类别或概念。
规则集:若干个逻辑规则组成的集合成为规则集。
两种逻辑规则:
命题规则:由”原子命题”和逻辑连接词 与、或、非和蕴含构成的简单陈述句(if-then规则)。
rule1:鱼类← ← (胎生 = no) ∧ (在水里生活 = yes)
rule2:鸟类← ← (胎生 = no) ∧ (会飞 = yes)
一阶规则:描述事物的属性和关系,称为关系型规则,额外包含了断言和量化。
解决问题的思路
目标:(贪心)找到一个规则集,这个规则集尽可能多的覆盖样例。
分类过程总结
通过规则集对未见示例进行分类的时候,我们每条逻辑规则都可以看做是一个子模型,规则集就是这些子模型的集合,将规则集与未见实例进行匹配,若匹配成功(满足规则体中的所有条件)则实例被预测为正例,若都不匹配则为负例。
问题
如果一个示例被多条逻辑规则覆盖时,判别发生了冲突?
冲突消解
投票法:将判别类别相同的规则数最多的结果作为判别结果。
排序法:带序规则学习/