当提到Erlang中list的++操作符时,我们常会想到它的性能问题。
有些人知道++操作比较耗时,就改用函数append来代替。
到底++操作和append函数之间有什么区别?
我们来查看一下它们在Erlang源码及C源码中的实现。
在$ERL_TOP/lib/stdlib/src/lists.erl可以找到如下代码:
在$ERL_TOP/erts/emulator/beam/erl_bif_lists.c中可以看到:
结合上面两个文件中的源码,我们可以得出这样的结论:
++操作,以及函数lists:append/1和lists:append/2,
在Erlang底层都是调用了C函数append(Process* p, Eterm A, Eterm B)来实现。
要想揭秘++操作是如何耗性能的,我们只有彻底弄清楚它们的底层实现。
一起来看看$ERL_TOP/erts/emulator/beam/erl_bif_lists.c文件中append函数的C实现:
以上分析中,我们知道了++操作的具体实现,但我还是有疑问。
这是因为Erlang的原则是变量一旦赋值就不可再变,如果直接对A进行了修改操作,将会有什么结果?
有些人知道++操作比较耗时,就改用函数append来代替。
到底++操作和append函数之间有什么区别?
我们来查看一下它们在Erlang源码及C源码中的实现。
在$ERL_TOP/lib/stdlib/src/lists.erl可以找到如下代码:
%% append(X, Y) appends lists X and Y
-spec append(List1, List2) -> List3 when
List1 :: [T],
List2 :: [T],
List3 :: [T],
T :: term().
append(L1, L2) -> L1 ++ L2. %% 使用了++操作
%% append(L) appends the list of lists L
-spec append(ListOfLists) -> List1 when
ListOfLists :: [List],
List :: [T],
List1 :: [T],
T :: term().
append([E]) -> E;
append([H|T]) -> H ++ append(T); %% 使用了++操作
append([]) -> [].
在$ERL_TOP/erts/emulator/beam/erl_bif_lists.c中可以看到:
/*
* erlang:'++'/2
*/
Eterm
ebif_plusplus_2(BIF_ALIST_2)
{
return append(BIF_P, BIF_ARG_1, BIF_ARG_2);
}
BIF_RETTYPE append_2(BIF_ALIST_2)
{
return append(BIF_P, BIF_ARG_1, BIF_ARG_2);
}
结合上面两个文件中的源码,我们可以得出这样的结论:
++操作,以及函数lists:append/1和lists:append/2,
在Erlang底层都是调用了C函数append(Process* p, Eterm A, Eterm B)来实现。
为什么Erlang的++操作耗性能?
要想揭秘++操作是如何耗性能的,我们只有彻底弄清楚它们的底层实现。
一起来看看$ERL_TOP/erts/emulator/beam/erl_bif_lists.c文件中append函数的C实现:
#define CONS(hp, car, cdr) \
(CAR(hp)=(car), CDR(hp)=(cdr), make_list(hp))
#define CAR(x) ((x)[0])
#define CDR(x) ((x)[1])
static BIF_RETTYPE append(Process* p, Eterm A, Eterm B)
{
Eterm list;
Eterm copy;
Eterm last;
size_t need;
Eterm* hp;
int i;
if ((i = list_length(A)) < 0) {
BIF_ERROR(p, BADARG);
}
if (i == 0) {
// A的长底为0,直接返回B
BIF_RET(B);
} else if (is_nil(B)) {
// B是一个空列表,直接返回A
BIF_RET(A);
}
need = 2*i;
// 为A的拷贝分配内存空间
hp = HAlloc(p, need);
list = A;
// 首先拷贝A的第一个元素,并初始化copy和last变量
// 为什么要两个变量指向同一值?
// 因为copy指向副本头部,以下不再对copy的变量值做任何修改,最后用来做函数的返回值
// last保持指向A副本的最后一个元素,最后要保存B的头指针值
copy = last = CONS(hp, CAR(list_val(list)), make_list(hp+2));
// 更新list变量值,让它指向A的第2个元素
list = CDR(list_val(list));
hp += 2;
// 注意,上面已经拷贝了A的第一个元素,所以要先i--
i--;
// 从A的第2个元素开始,逐个拷贝
while(i--) {
// 取出list指向的元素,8字节,
// CAR(listp)为指向当前元素值的指针值
// CDR(listp)为指向下一个元素的指针值
Eterm* listp = list_val(list);
// 注意make_list(hp+2),直至拷贝完成,这个列表的next指针都是指向下一个内存空间,
// last总是指向最新的元素,因为是从A的头部开始拷贝的,
// 所以last最终也就是指向A副本的最后一个元素
last = CONS(hp, CAR(listp), make_list(hp+2));
// 让list移动到下一个元素
list = CDR(listp);
hp += 2;
}
// 上面的拷贝之后,副本尾部没有NIL值,在这里正好把这个位置的值更新为B的值,
// 至此,两个list的合并完成
CDR(list_val(last)) = B;
// 返回副本头部的指针值
BIF_RET(copy);
}
以上分析中,我们知道了++操作的具体实现,但我还是有疑问。
为什么Erlang中++操作时要拷贝左边的list?
为什么要对A进行拷贝?
如果通过遍历找到A尾部的NIL值,并把它更新为B的指针值不就OK了?这是因为Erlang的原则是变量一旦赋值就不可再变,如果直接对A进行了修改操作,将会有什么结果?
我认为这也是一个在写NIF时需要注意的问题。
Erlang ++操作符使用小结
- 尽量把长度较小的list放在左边。
- 如果左边的list长度很小,并不会造成很大的性能影响,这种情况下可以放心使用++操作符。
- lists:append/2函数最终也是调用++操作来完成,还不如直接使用++明了。
- 如果需要合并的list个数是未知的,可以使用函数lists:append/1来完成。