大数据量下的高性能字符串处理 string.Substring优化

本文讨论了一种针对大量文本处理的性能优化案例。通过对比Substring和Split方法与StringBuilder.CopyTo()方法,作者展示了在遍历和截取文本行时,如何将执行时间从60秒降低到25毫秒,强调了在处理大量文本时选择高效方法的重要性。
摘要由CSDN通过智能技术生成

有一个txt文本,我需要对他每一行进行遍历,并在匹配的地方做文本截取,

常规情况下肯定就直接用string.Substring,但一测试,耗时直接干到60000ms,也就是60s.

如下面代码中被注释掉的部分,无论是用Substring还是Split都在60s左右.(还不是每一行都要截取)

最后使用了StringBuilder.CopyTo(),直接从60000ms降到25ms

代码中其他的代码作用不用管,测试过,那些逻辑耗时不到5ms,

修改前:


            for (var i = 0; i < lines.Count; i++)
            {
                var instance = lines[i];
                if (i > 0) offset += 2;//+2是换行符
                offsetsDic.Add(i, new KeyValuePair<int, int>(offset, offset += instance.LineText.Length));
                var LineText = instance.LineText.Trim();
                if (instance.LineText.Length > 2 && LineText[0] == '[' && LineText[1] == '@')
                {
                    //var index = LineText.IndexOf(']');
                    //var funName = index > -1 ? LineText.Substring(0, index) : LineText;
                    //var funName = instance.LineText.Split(new char[] { ' ', '\t' }, StringSplitOptions.RemoveEmptyEntries).FirstOrDefault().ToUpperInvariant();
                    fieldLineoffset.Add(i, funName);
                }
                else
                {
                    if (fieldLineoffset.Any())
                        fieldLineoffset.Add(i, fieldLineoffset[i - 1]);
                }
            }

修改后: text 就是 lines的原文本

var sb = new StringBuilder(text);
            for (var i = 0; i < lines.Count; i++)
            {
                var instance = lines[i];
                if (i > 0) offset += 2;//+2是换行符
                offsetsDic.Add(i, new KeyValuePair<int, int>(offset, offset + instance.LineText.Length));
                var LineText = instance.LineText.Trim();
                if (instance.LineText.Length > 2 && LineText[0] == '[' && LineText[1] == '@')
                {
                    var funName = LineText;
                    var index = LineText.IndexOf(']');
                    if (index > -1)
                    {
                        var chars = new char[instance.LineText.Length - LineText.Length + index];
                        sb.CopyTo(offset + (instance.LineText.Length - LineText.Length), chars, 0, chars.Length);
                        funName = new string(chars);
                    }
                    fieldLineoffset.Add(i, funName);
                }
                else
                {
                    if (fieldLineoffset.Any())
                        fieldLineoffset.Add(i, fieldLineoffset[i - 1]);
                }
                offset += instance.LineText.Length;
            }

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值