DSL 是drools的Domain Specification Language(领域特定语言),其目的是将规则语言扩充到自己的问题领域,并且以自然语言的方式来表达规则。听起来很美好,但是实际使用起来,首先一个问题就发现,一点也不中国啊。如果要想写汉语规则还是存在很多问题。
通过跟踪出错信息,最终定位到,之所以无法定位汉语还是由于词法分析器DSLMapLexer的原因。而DSLMapLexer是继承的org.antlr.runtime.Lexer类,那么这个地方可能就是antlr的限制了。查看antlr的手册,antlr缺省识别的字符表(char vocabulary)是ascii字符。而antlr是支持通过制定charVocabulary选项来支持unicode和8位字符的,只不过DSLMapLexer没有制定此选项。鉴于此,打算修改一下DSLMapLexer使能支持中文。
拟定方案:
1。 修改DSLMapLexer,使其可以识别8位字符。 之所以不去识别unicode,utf8,gb2312等,是因为一个是编码各不相同,一个是有的是DBCS,有的是MBCS,如果全部要Lexer去分析,性能会非常慢。而如果承认了8位字符,基本上也就可以完成了中文的识别,可能会存在个别中文无法识别的情况,那个就让使用时注意规避好了。
2。 重新编译新的drools,测试是否成功。
实际情况:
实际观察发现,选项的设定,是在DSLMap.g , 应该修改这个文件就可以了吧,而如果需要使用中文的内容在DRL中,是不是还要修改DRL.g ,有可能,以后调查了再说。
先还得学习如何从源码安装Drools。这篇笔记就先到这里,学过源码安装drools后,再继续。