Unix编程艺术---数据驱动编程

本文探讨了数据驱动编程的核心理念,通过Unix设计原则中的‘表示原则’,将程序逻辑转移到数据中,提升可读性、易维护性和扩展性。实例分析了消息处理流程的优化,展示了如何通过表驱动法减少代码复杂度并提高灵活性。
摘要由CSDN通过智能技术生成

   《Unix编程艺术》作者在介绍Unix设计原则时,其中有一条为“表示原则:把知识叠入数据以求逻辑质朴而健壮”。
数据驱动编程的核心

数据驱动编程的核心出发点是相对于程序逻辑,人类更擅长于处理数据。数据比程序逻辑更容易驾驭,所以我们应该尽可能的将设计的复杂度从程序代码转移至数据。真的是这样吗?让我们来看一个示例。

假设有一个程序,需要处理其他程序发送的消息,消息类型是字符串,每个消息都需要一个函数进行处理。第一印象,我们可能会这样处理:

void msg_proc(const char *msg_type, const char *msg_buf)
{
    if (0 == strcmp(msg_type, "inivite"))
    {
        inivite_fun(msg_buf);
    }
    else if (0 == strcmp(msg_type, "tring_100"))
    {
        tring_fun(msg_buf);
    }
    else if (0 == strcmp(msg_type, "fail_486"))
    {
        fail_486_fun(msg_buf);
    }
    else
    {
        log("未识别的消息类型%s\n", msg_type);
    }
}

上面的消息类型取自sip协议(不完全相同,sip协议借鉴了http协议),消息类型可能还会增加。看着常常的流程可能有点累,检测一下中间某个消息有没有处理也比较费劲,而且,没增加一个消息,就要增加一个流程分支。

按照数据驱动编程的思路,可能会这样设计:

typedef void (*SIP_MSG_FUN)(const char *);
 
typedef struct __msg_fun_st
{
    const char *msg_type;//消息类型
    SIP_MSG_FUN fun_ptr;//函数指针
}msg_fun_st;
 
msg_fun_st msg_flow[] =
{
        {"inivite", inivite_fun},
        {"tring_100", tring_fun},
        {"fail_486", fail_486_fun}
};
 
void msg_proc(const char *msg_type, const char *msg_buf)
{
    int type_num = sizeof(msg_flow) / sizeof(msg_fun_st);
    int i = 0;
 
    for (i = 0; i < type_num; i++)
    {
        if (0 == strcmp(msg_flow[i].msg_type, msg_type))
        {
            msg_flow[i].fun_ptr(msg_buf);
            return ;
        }
    }
    log("未识别的消息类型%s\n", msg_type);
}

下面这种思路的优势:

1、可读性更强,消息处理流程一目了然。

2、更容易修改,要增加新的消息,只要修改数据即可,不需要修改流程。

3、重用,第一种方案的很多的else if其实只是消息类型和处理函数不同,但是逻辑是一样的。下面的这种方案就是将这种相同的逻辑提取出来,而把容易发生变化的部分提到外面。


隐含在背后的思想:

很多设计思路背后的原理其实都是相通的,隐含在数据驱动编程背后的实现思想包括:

1、控制复杂度。通过把程序逻辑的复杂度转移到人类更容易处理的数据中来,从而达到控制复杂度的目标。

2、隔离变化。像上面的例子,每个消息处理的逻辑是不变的,但是消息可能是变化的,那就把容易变化的消息和不容易变化的逻辑分离。

3、机制和策略的分离。和第二点很像,本书中很多地方提到了机制和策略。上例中,我的理解,机制就是消息的处理逻辑,策略就是不同的消息处理(后面想专门写一篇文章介绍下机制和策略)。


数据驱动编程可以用来做什么:

如上例所示,它可以应用在函数级的设计中。

同时,它也可以应用在程序级的设计中,典型的比如用表驱动法实现一个状态机(后面写篇文章专门介绍)。

也可以用在系统级的设计中,比如DSL(这方面我经验有些欠缺,目前不是非常确定)。


它不是什么:

1、 它不是一个全新的编程模型:它只是一种设计思路,而且历史悠久,在unix/linux社区应用很多;

2、它不同于面向对象设计中的数据:“数据驱动编程中,数据不但表示了某个对象的状态,实际上还定义了程序的流程;OO看重的是封装,而数据驱动编程看重的是编写尽可能少的代码。”

关于表驱动法,在《unix编程艺术》中有提到,更详细的描述可以看一下《代码大全》,有一章专门进行描述(大概是第八章)。
 

考虑一个消息(事件)驱动的系统,系统的某一模块需要和其他的几个模块进行通信。它收到消息后,需要根据消息的发送方,消息的类型,自身的状态,进行不同的处理。比较常见的一个做法是用三个级联的switch分支实现通过硬编码来实现:

 

switch(sendMode)  
{  
    case:  
}  
switch(msgEvent)  
{  
    case:  
}  
switch(myStatus)  
{  
    case:  
}  
  1.  

这种方法的缺点:
1、可读性不高:找一个消息的处理部分代码需要跳转多层代码。
2、过多的switch分支,这其实也是一种重复代码。他们都有共同的特性,还可以再进一步进行提炼。
3、可扩展性差:如果为程序增加一种新的模块的状态,这可能要改变所有的消息处理的函数,非常的不方便,而且过程容易出错。
4、程序缺少主心骨:缺少一个能够提纲挈领的主干,程序的主干被淹没在大量的代码逻辑之中。

用表驱动法来实现:
根据定义的三个枚举:模块类型,消息类型,自身模块状态,定义一个函数跳转表:

typedef struct  __EVENT_DRIVE  
{  
    MODE_TYPE mod;//消息的发送模块  
    EVENT_TYPE event;//消息类型  
    STATUS_TYPE status;//自身状态  
    EVENT_FUN eventfun;//此状态下的处理函数指针  
}EVENT_DRIVE;  
  
EVENT_DRIVE eventdriver[] = //这就是一张表的定义,不一定是数据库中的表。也可以使自己定义的一个结构体数组。  
{  
    {MODE_A, EVENT_a, STATUS_1, fun1}  
    {MODE_A, EVENT_a, STATUS_2, fun2}  
    {MODE_A, EVENT_a, STATUS_3, fun3}  
    {MODE_A, EVENT_b, STATUS_1, fun4}  
    {MODE_A, EVENT_b, STATUS_2, fun5}  
      
    {MODE_B, EVENT_a, STATUS_1, fun6}  
    {MODE_B, EVENT_a, STATUS_2, fun7}  
    {MODE_B, EVENT_a, STATUS_3, fun8}  
    {MODE_B, EVENT_b, STATUS_1, fun9}  
    {MODE_B, EVENT_b, STATUS_2, fun10}  
};  
  
int driversize = sizeof(eventdriver) / sizeof(EVENT_DRIVE)//驱动表的大小  
  
EVENT_FUN GetFunFromDriver(MODE_TYPE mod, EVENT_TYPE event, STATUS_TYPE status)//驱动表查找函数  
{  
    int i = 0;  
    for (i = 0; i < driversize; i ++)  
    {  
        if ((eventdriver[i].mod == mod) && (eventdriver[i].event == event) && (eventdriver[i].status == status))  
        {  
            return eventdriver[i].eventfun;  
        }  
    }  
    return NULL;  
}  
  1.  

这种方法的好处:
1、提高了程序的可读性。一个消息如何处理,只要看一下驱动表就知道,非常明显。
2、减少了重复代码。这种方法的代码量肯定比第一种少。为什么?因为它把一些重复的东西:switch分支处理进行了抽象,把其中公共的东西——根据三个元素查找处理方法抽象成了一个函数GetFunFromDriver外加一个驱动表。
3、可扩展性。注意这个函数指针,他的定义其实就是一种契约,类似于java中的接口,c++中的纯虚函数,只有满足这个条件(入参,返回值),才可以作为一个事件的处理函数。这个有一点插件结构的味道,你可以对这些插件进行方便替换,新增,删除,从而改变程序的行为。而这种改变,对事件处理函数的查找又是隔离的(也可以叫做隔离了变化)。、
4、程序有一个明显的主干。
5、降低了复杂度。通过把程序逻辑的复杂度转移到人类更容易处理的数据中来,从而达到控制复杂度的目标。
 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值