Redy词法识别--整数,长整数的识别

返回文档首页


(一)简介

代码下载: git clone git://git.code.sf.net/p/redy/code redy-code


当我们需要识别文本时,通常分析步骤为:

  1. 根据文本内容的规律推导一个上下文无关文法,但最好是正则文法。
  2. 根据文法画出状态机。
  3. 把状态机转化为状态矩阵。

这一章的内容有:

  1. 整数,长整数的识别

(二)整数,长整数的识别

(1)整数与长整数

在Redy中整数与长整数的区别为:长整数在整数后面多加了一个后缀L或者 l。

整数总其分这么几种:

  1. 十进制整数
  2. 二进制整数:以0B或者0b开头的数,如0B10001010 , 0b0101001
  3. 人进制整数:以0o或者0O或者0开头的数,如0O741525463, 0o1455,0214
  4. 十六进制数:以0x或者0X开头的数,如0x25445fa,0Xfffa45

(2)BNF文法

longinteger    ::=  integer ("l" | "L")
integer        ::=  decimalinteger | octinteger | hexinteger | bininteger
decimalinteger ::=  nonzerodigit digit* | "0"
octinteger     ::=  "0" ("o" | "O") octdigit+ | "0" octdigit+
hexinteger     ::=  "0" ("x" | "X") hexdigit+
bininteger     ::=  "0" ("b" | "B") bindigit+
nonzerodigit   ::=  "1"..."9"
octdigit       ::=  "0"..."7"
bindigit       ::=  "0" | "1"
hexdigit       ::=  digit | "a"..."f" | "A"..."F"

(3)状态机


其中Decimal表示十进制,Oct表示8进制,Hex表示16进制,Bin表示2进制,long表示长整数。

Dn_m表示数字n到m

(4)状态矩阵

对于整数长整数来说输入类型可以分为这么几种:

  1. 数字0   (D0)
  2. 数字1   (D1)
  3. 数字2到7 (D2_7)
  4. 数字8到9  (D8_9)
  5. 字母a和A  (S_a)
  6. 字母B和b (S_b)
  7. 字母c到f和C到F (S_c_f)
  8. 长整数标志符l与L  (S_l)
  9. 八进制前缀o和O (S_o)
  10. 十六进制前缀x和X (S_x)
  11. 除以上字符以外的类型 (other)

其中:

D0_9 包含 D0 , D1  , D2_7 , D8_9

D0_7 包含 D0 , D1  , D2_7

D1_9 包含 D1 , D2_7 , D8_9

S_a_f 包含 S_a , S_b , S_c_f 


状态转化矩阵为:

状态\输入

Other

D0

D1

D2_7

D8_9

S_a

S_b

S_c_f

S_o

S_x

S_l

Begin


Prefix

Decimal

Decimal

Decimal







  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值