相关文章:
句法模式识别/结构模式识别(一)—概述
句法模式识别/结构模式识别(二)—形式语言
句法模式识别/结构模式识别(四)—句法分析
句法模式识别/结构模式识别(五)—自动机
一、定义
在统计模式识别方法中,经常用已知类别的模式样本集训练判别函数,同样在句法模式识别中,也可以用已知类别的模式样本集来训练类别文法,这种训练过程或者说学习过程称为文法推断。文法推断就是要构造出能正确描述某类模式的文法,其中主要是求生成式集合P。前面关于模式描述方法的讨论是在假定文法已知的前提下进行的。
每一类模式有一个文法,由于模式用句子表示,而句子可以由链、树、图表示,所以相应地就有链文法、树文法和图文法的推断问题。当选择了文法的形式之后,就可以根据一组数目足够且具有代表性的样本来推断文法。
简而言之:用已知类别的模式样本集训练类别文法的过程
二、目的
通过文法推断可以得到一组重写规则,它们除了能描述给定的有限样本集外,还能描述那些虽不在给定样本集内但却与给定样本集在某种意义上有同样性质(属于同一类)的模式,从而可以用这一组重写规则对输入模式进行句法分析以达到识别的目的。
文法推断过程就是对模式类进行描述的过程,它的正确性在很大程度上决定于所给样本集的完备性和人们对模式性质了解的程度,文法推断算法至今仍然是句法模式识别中的一个重要研究课题。
简而言之:构造出能够正确描述某类模式的文法,其中主要是求生成式集合P
三、与机器学习的区别和联系
文法推断(Grammatical Inference)与机器学习(Machine Learning)的区别,机器学习是狭义的(或标准的)机器学习。从广义上讲,文法推断也属于机器学习的范畴。
两者的共同之处都是从有限的经验数据自动学习知识,尝试找到一种隐藏在样本数据背后的模式。机器学习的处理对象是数值型数据,学习结果是对数据分类和回归分析;文法推断的处理对象是字符序列,学习结果是生成字符序列的形式文法。