我要识别的字符串格式是使用单引号或双引号引起来的一个字符序列,如
"hello world"
或
'hello world'
Antlr4可以这样写词法规则
QuotedString: DoubleString | SingleString ;
fragment
DoubleString: '"' .*? '"' ;
fragment
SingleString: '\'' .*? '\'' ;
但是,当我的字符串中存在转义的引号时,上边的词法规则是无法正确识别的,如
"hello \"world\""
或
'hello \'world\''
此时,词法规则进行如下修改,可正确识别
QuotedString: DoubleString | SingleString ;
fragment
DoubleString: '"' ('\\"'|~["])* '"' ;
fragment
SingleString: '\'' ('\\\''|~['])* '\'' ;
即:
双引号字符串的内容可以包含\",但不包含"
单引号字符串的内容可以包含\’,但不包含’