Erlang list的++操作和append函数的底层实现

最新推荐文章于 2020-12-15 17:40:58 发布

铿锵玫瑰

最新推荐文章于 2020-12-15 17:40:58 发布

阅读量1.4k

点赞数

分类专栏： Erlang 文章标签： Erlang 编程性能

Erlang 专栏收录该内容

33 篇文章 1 订阅

订阅专栏

原文：http://blog.csdn.net/zhongruixian/article/details/9417201

当提到Erlang中list的++操作符时，我们常会想到它的性能问题。

有些人知道++操作比较耗时，就改用函数append来代替。

到底++操作和append函数之间有什么区别？

我们来查看一下它们在Erlang源码及C源码中的实现。

在$ERL_TOP/lib/stdlib/src/lists.erl可以找到如下代码：

[plain]view plaicopy 
   
 %% append(X, Y) appends lists X and Y  
   
   
 -spec append(List1, List2) -> List3 when  
       List1 :: [T],  
       List2 :: [T],  
       List3 :: [T],  
       T :: term().  
    
 append(L1, L2) -> L1 ++ L2. %% 使用了++操作  
   
   
 %% append(L) appends the list of lists L  
   
   
 -spec append(ListOfLists) -> List1 when  
       ListOfLists :: [List],  
       List :: [T],  
       List1 :: [T],  
       T :: term().  
   
   
 append([E]) -> E;  
 append([H|T]) -> H ++ append(T); %% 使用了++操作  
 append([]) -> [].  

在$ERL_TOP/erts/emulator/beam/erl_bif_lists.c中可以看到：

[cpp]view plaincopy 
   
 /* 
  * erlang:'++'/2 
  */  
   
   
 Eterm  
 ebif_plusplus_2(BIF_ALIST_2)  
 {  
     return append(BIF_P, BIF_ARG_1, BIF_ARG_2);  
 }  
   
   
 BIF_RETTYPE append_2(BIF_ALIST_2)  
 {  
     return append(BIF_P, BIF_ARG_1, BIF_ARG_2);  
 }  

结合上面两个文件中的源码，我们可以得出这样的结论：

++操作，以及函数lists:append/1和lists:append/2，
在Erlang底层都是调用了C函数append(Process* p, Eterm A, Eterm B)来实现。

为什么Erlang的++操作耗性能？

要想揭秘++操作是如何耗性能的，我们只有彻底弄清楚它们的底层实现。

一起来看看$ERL_TOP/erts/emulator/beam/erl_bif_lists.c文件中append函数的C实现：

[cpp]view plaincopy 
   
 #define CONS(hp, car, cdr) \  
         (CAR(hp)=(car), CDR(hp)=(cdr), make_list(hp))  
   
   
 #define CAR(x)  ((x)[0])  
 #define CDR(x)  ((x)[1])  
   
   
 static BIF_RETTYPE append(Process* p, Eterm A, Eterm B)  
 {  
     Eterm list;  
     Eterm copy;  
     Eterm last;  
     size_t need;  
     Eterm* hp;  
     int i;  
   
   
     if ((i = list_length(A)) < 0) {  
         BIF_ERROR(p, BADARG);  
     }  
     if (i == 0) {  
         // A的长底为0，直接返回B  
         BIF_RET(B);  
     } else if (is_nil(B)) {  
         // B是一个空列表，直接返回A  
         BIF_RET(A);  
     }  
   
   
     need = 2*i;  
     // 为A的拷贝分配内存空间  
     hp = HAlloc(p, need);  
     list = A;  
     // 首先拷贝A的第一个元素，并初始化copy和last变量  
     // 为什么要两个变量指向同一值？  
     // 因为copy指向副本头部，以下不再对copy的变量值做任何修改，最后用来做函数的返回值  
     // last保持指向A副本的最后一个元素，最后要保存B的头指针值  
     copy = last = CONS(hp, CAR(list_val(list)), make_list(hp+2));  
     // 更新list变量值，让它指向A的第2个元素  
     list = CDR(list_val(list));  
     hp += 2;  
     // 注意，上面已经拷贝了A的第一个元素，所以要先i--  
     i--;  
     // 从A的第2个元素开始，逐个拷贝  
     while(i--) {  
         // 取出list指向的元素，8字节，  
         // CAR(listp)为指向当前元素值的指针值  
         // CDR(listp)为指向下一个元素的指针值  
         Eterm* listp = list_val(list);  
         // 注意make_list(hp+2)，直至拷贝完成，这个列表的next指针都是指向下一个内存空间，  
         // last总是指向最新的元素，因为是从A的头部开始拷贝的，  
         // 所以last最终也就是指向A副本的最后一个元素  
         last = CONS(hp, CAR(listp), make_list(hp+2));  
         // 让list移动到下一个元素  
         list = CDR(listp);  
         hp += 2;  
     }  
     // 上面的拷贝之后，副本尾部没有NIL值，在这里正好把这个位置的值更新为B的值，  
     // 至此，两个list的合并完成  
     CDR(list_val(last)) = B;  
     // 返回副本头部的指针值  
     BIF_RET(copy);  
 }