本来想自己写一下,不小心看到了大佬的一篇文章,非常详细全面。
https://www.jianshu.com/p/1e8ab8fe55e4
伪代码概要
if 数组最后一位 == nil then
则二分查找往前找到一个不是nil的返回长度
else if 数组最后一位 ~=nil and 散列桶部分 == nil then
return 数组长度
else
计算散列桶部分的长度
local function 计算散列桶部分的长度()
从数组长度+1 开始查找, 同样二分查找 (只针对散列桶部分的key为正整数的数据)
end
如果有新增元素,需要考虑重新分配数组和散列桶大小的因素。 重新分配的数组大小按照50%利用率的原则。
(50%利用率原则是,rehash的时候首先将所有正整数的key在2n–2n+1之间统计。比如:
[1,2] = 1
[2,4] = 2
[4,8] = 1 …
然后依次计算满足在[1, 2n] 之间的个数大于50%的条件,作为数组的长度,其余的放入散列桶中)
所以,给出的建议是:
(1)尽量不要在一个表中混用数组或散列桶部分,即一个表最好只存放一类数据。lua的实现上确实提供了两者统一表示的遍历,但是这并不意味着使用者就应该混用这两种方式。
(2)尽量不要在表中存放nil值,这会让取长度操作的行为不稳定。
(3)尽量避免重新散列操作,因为这个操作的代价极大,通过预分配、只使用数组部分等策略规避这个lua解释器背后的动作,能提升不少效率。