从零编写一个解析器(2)—— 字符串解析

  • 文章名称:从零编写一个解析器(2)—— 字符串解析
  • 参考地址:https://github.com/Geal/nom/blob/master/examples/string.rs
  • 文章来自:https://github.com/suhanyujie/my-parser-rs
  • 文章作者:suhanyujie
  • Tips:文章如果有任何错误之处,还请指正,谢谢~
  • 标签:Rust,parser

在代码中,我们经常会声明变量、声明字符串,然后编写业务逻辑,然后你是否有想过,编译器是如何读懂你的变量声明,你的代码逻辑。
在这个文章中,我们先从字符串开始,了解如何通过代码来识别代码,解析你所编写的内容是什么。

在 Rust 中,我们可以声明一个字符串:let s1 = String::from("hello world");
也可以像这样声明一个字符引用(字符串常量):let s1: &'static = "hello world";
但 Rust 的字符串中比较特殊,首先,Rust 中的字符类型是 Unicode 标量值,其中可以存储所有的 utf-8 字符,占用 4 字节

Rust 的字符串是 utf-8 编码,长度可动态增长的类型,它在底层通常是由一些列的字节序列构成,经过一些特定的编码后,就能得到你想要的字符串了。

此外,在 Rust 字符串中,还支持携带转义的 Unicode 字符,如:String::from("\u{1231}")
因此,我们先确定好支持的常见情况,以及一些特殊的情况。

常见情况

所谓通用的情况,就是最常见的字符串字面量,如:"hello world"。通过前面的实践,我们可以很快地写出解析该字符串的解析器:

fn parse_normal_str1<'a>(input: &'a str) -> IResult<&'a str, String> {
    let mut parser = delimited(tag("\""), is_not("\n\""), tag("\""));
    let res = parser(input);
    match res {
        Ok((remain, result)) => {
            return Ok((remain, result.to_string()));
        }
        Err(err) => {
            return Err(err);
        }
    }
}

通过解析器 parse_normal_str1,将源字符串解析,返回剩余部分,以及解析出的字符串结果。我们视所有的字符串都是以 " 开始,以 " 结束。
只需通过 delimited 我们可以很容易地将字符串从 "" 中分离出来。运行一个测试用例:

 fn test1() {
    let s = r##""hello world""##;
    assert_eq!(pars
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值