Lua—字符串缓冲

最新推荐文章于 2023-08-05 17:02:19 发布

甜甛恬栝湉铦i

最新推荐文章于 2023-08-05 17:02:19 发布

阅读量561

点赞数 1

分类专栏： Lua

本文链接：https://blog.csdn.net/ts596705957/article/details/104412220

版权

Lua 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

字符串缓存

正常我们读取文件时，会写这样一段代码：

local buff = ""
for line in io.lines() do
buff = buff..line..'\n'
end

这段代码，看着可以正常工作，但是面对较大的文件时，工作效率就极低，且会导致巨大的性能开销。
例如，用这段代码读入350KB的文件数据，就需要将近1分钟的时间。
我们来搞清楚运行这段代码的时候，具体做了哪些流程。

假设我们现在在读取的环节，假设每一行20个字节，已经读入2500行，那么现在buff就是一个50KB的字符串。而当Lua作为字符串连接buff…line时就会创建一个长为50020字节的新字符串，并从buff中复制了50000字节到新的字符串，这样对于后面的每一行数据，Lua都需要移动50KB或者更多的内存。在读取100行(大于2KB)的数据，Lua已经移动了5MB的内存，而且我们的代码具有2次复杂度，最后读取完350KB的数据，Lua则会移动50GB的数据，想想就恐怖。

所以在Lua中读取大量文件时，提供了一个io.read("*all")选项。
另外还有一种方法，用table作为一个缓冲区，用到一个关键函数 table.concat
这个函数什么作用呢？首先它会将给定列表的所以字符串连接起来，并且返回连接的结果。用concat重写上面的代码如下：

local t= {}
for line in io.lines() do
    t[#t+1]=line	
end
t[#t+1] = ""
table.concat(t,"\n")

从内部来看，concat和io.read("*all")都使用了同一个算法拼接小的字符串，我们来分析它是如何工作的。
开始时，使用的是线性的方法来连接字符串，把较小的字符串逐个连接起来，最后将连接的结果存入到一个累加器中。而新的算法避免这么做，他采用二分的方法，从某种情况下将小的字符串拼接起来
，然后再将结果字符串与更大的字符串拼接起来。其算法核心是一个栈，已创建的大字符串位于栈的底部，而较小的字符串则通过栈顶进入。对栈中元素处理的方式很像“汉诺塔”的问题，栈中的任意字符串都比下面的字符串短。如果新加入的字符串比下面已存在的字符串长，则把两者连接起来。然后，再将连接后的新字符串与更下面的字符串作比较，如果新建的字符串更长的话，则再次连接他们。这样一直向下延续应用，直到遇到更大的字符串或者到达栈底停止。

function addString(stack ,s)
  stack[#stack+1] = s      --将s压入栈中
  for #stack-1,1,-1 do
     if #stack[i] > #stack[i+1] then
        break
     end
     stack[i] = stack[i]..stack[i+1]
     stack[i+1]=nil
  end

为了获取栈缓存的最终内容，只需连接所有的字符串就可以了。

甜甛恬栝湉铦i

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Lua—字符串缓冲

字符串缓存正常我们读取文件时，会写这样一段代码：local buff = ""for line in io.lines() dobuff = buff..line..'\n'end这段代码，看着可以正常工作，但是面对较大的文件时，工作效率就极低，且会导致巨大的性能开销。例如，用这段代码读入350KB的文件数据，就需要将近1分钟的时间。我们来搞清楚运行这段代码的时候，具体做了哪些流程...
复制链接

扫一扫