java中parser_愿你走出半生,归来仍是Java Parser

020dd7a21387d3424b099b35f2a7c13d.png

几天前,我的一个朋友给了我一个Haskell问题

Hey, MK,假设我有个BNF,并且我在Haskell中有个这个BNF的parser。

现在,我想给这个BNF改一行,有没有办法不用动这个BNF parser的代码(因为是其他人写的),而是对这parser进行扩展呢?

这问题挺有趣的,也不算难。

这问题说是extensibility problem,其实有两个地方需要扩展。

0:Parser需要用open recursion之类的方法扩展

1:Parse出来的ADT也需要可扩展性

后半个需求见多了,Final Tagless,DTALC,Tree that grow,Recursion scheme style fix。。。于是放下不表,我们来处理前一个。

前半个。。Haskell's Overlooked Object System就搞过,当然他们有点heavy weight,打算随手弄一个超级轻量级的:5行就够了,多一行是小莎莎。

Ready?

1 data Object x = MkObject (x -> x)

1。Inheritance is not subtyping式的Object=recursive type。为了简易性(反正也不需要多高的扩展性)就不model真。recursive type,而只有recursive dependency。

1 use :: Object x ->x2 use (MkObject x) = let res = x res in res

2。3。最典型的tying the knot。其实就是fix了。

我们想想,这个x是什么variant的呢?covariant还是contravariant?

1 inherit :: (a -> b) -> (b -> a) -> Object a ->Object b2 inherit ab ba (MkObject aa) = MkObject (ab . aa . ba)

既然是invariant,那fmap contramap都用不上,但invariant依然能有map:两边一起传进来就行了。4。5。

这就是一个prototype based oo system了。

接下来讲怎么用哈:

1 test :: Object (Int, Int)2 test = MkObject $ \self -> (2, fst self + fst self)

这弄了个两个field的object,第零个field初始值为2(可能因为继承被override),第一个field为第零个field的值*2(不一定是3,如果任何field被override这个值都能改)。use test应该是(2, 4)。

1 inheritTest :: Object ((Int, Int), Int)2 inheritTest = inherit (\(l, r) -> ((l + 1, r + 2), r + 1)) fst test

这里继承了上面的Object,override了l(l + 1是super + 1),r被override到super + 2,加了个新的field,值是r+1。use inheritTest应该是((3, 8), 7)。记着传进来的参数不是self而是super就很好理解了。

好,open recursion搞好了,剩下的就是标准的final tagless了,体力活,没啥意思

1 classAST repr where2 lit :: Int ->repr3 plus :: repr -> repr ->repr4

5 classVar repr where6 var :: String ->repr7

8 type WholeParser repr =Parser repr9 type LitParser repr =Parser repr10 type PlusParser repr =Parser repr11

12 intP :: Parser Int13 intP = read many1 digit14

15 stringP :: Parser String16 stringP =many1 letter17

18 type OriginalParser repr =((LitParser repr, PlusParser repr), WholeParser repr)19 originalParser :: AST repr =>Object (OriginalParser repr)20 originalParser = MkObject $ \(~(_, p)) ->let21 litP = lit intP22 plusP = between (char '(') (char ')') (do {l plusP in24 ((litP, plusP), wholeP)25

26 type VarParser repr =Parser repr27 extendedParser :: (AST repr, Var repr) =>Object (VarParser repr, OriginalParser repr)28 extendedParser =inherit extend snd originalParser29 where30 extend ~((litP, plusP), wholeP) =let31 varP = var stringP in32 (varP, ((litP, plusP), varP wholeP))33

34 instance AST String where35 lit =show36 plus x y = "(" ++ x ++ " " ++ "+" ++ " " ++ y ++ ")"

37

38 instance Var String where39 var x = x

大功告成。

Q:封装呢?

A:Abstract Type is Existential Type

Q:这是prototype based的,class怎么办?

A:A Theory Of Object里面讲过怎么用prototype来做class

Q:多继承呢?

A:给定Object a,Object b,可以组合出Object (a, b),要菱形继承自己手动再inherit一下就好

Q:Subtyping?

A:Typeclass。

如果大家感兴趣,请评论下,我可以再写个blog把这些功能补完。

java精神(基于函数式组合子逻辑的javaparser框架) 一。 释名。 为什么叫精神? 如果你熟悉c++,那么你可能知道一个叫做”spirit”的parser库。它利用c++的模板元编程能力,使用c++语言本身提供了一个递归下降文法解析的框架。 我这里介绍的jparsec库,就是一个java里面的递归下降文法解析框架。 不过,它并非是spirit的java版本。 Jparsec的蓝本来自Haskell语言的parsec库。Parsec是一个基于monad的parser组合子库。 这个库的目的是要在java提供一个类似parsec, spirit的库,这种组合子库并非c++的专利,java/c#也可以做到。这个库还将在java5.0上被改写,类型安全上它将也不再逊色于c++。 那么,为什么叫“函数式”呢?java是面向对象的嘛。 如果你使用过haskell, lisp等语言,这个函数式不用解释你也知道是怎么回事了。 如果你是一个老牌的c++/java程序员,那么这里还要稍微解释一下。当然如果您对这些虚头八脑的名词不感兴趣,那么,你尽可以跳过这一章,不知道什么是“函数式”,并不会影响你对这个库的理解的。 C++这几年随着gp的普及,“函数式”这个老孔乙己逐渐又被人从角落里面拽了出来。一个c++程序员所熟悉的“函数式”很可能是stl的for_each, transform,count_if这些函数。 怎么说呢,就象我不能否定str.length()这个调用属于OO一样,我也无法说for_each, transform不是函数式。 但是,“函数式”的精髓不在于此。 一般归纳起来,就像我们说OO是什么多态,封装,继承一样,“函数式”的特征被总结为: 1。无副作用。 2。高阶函数。 3。延迟计算 而最最有意义的(至少我认为如此),是基于高阶函数的函数组合能力。一些人把这叫做glue。 简短地说,什么让函数式编程如此强大?是用简单的函数组合出复杂函数的能力。 我可以想象,说到这里,你还是一头雾水。“什么是组合?1+1不是也把两个1组合成2了吗?new A(new B(), new C())不也是从B和C组合成A了?”
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值