高效操作字串的String Reference类

原创 2016年02月06日 06:57:01

如下面的代码中一个函数接受一个std::string常量引用,在其函数内部需要使用std::string的一些函数操作字串。

void foo(const std::string& param) {
  ......
}

参数使用的是常量引用,如果传入一个std::string就不需要额外的拷贝。但是如果调用时传入的是一个字串常量,这时必然会生成一个std::string对象,并且会有一次内存拷贝。

关于字串发生拷贝可以使用下面的代码测试:

#include <string>
namespace {
const char* sString = "123456";

void foo(const std::string& str) {
  printf ("input string address: %x\n", str.c_str() );
}
}  // namespace

int main()
{
  printf("const string address: %x\n", sString);
  foo(sString);
  return 0;
}

这是一个很典型的问题,事实上只要不修改字串内容,并不需要另外复制一份。特别是对一些比较大的字串,避免拷贝对内存和性能都有极大的好处。于是Jeffrey Yasskin提出一个String reference : a non-owning reference to a string. 很多大型的项目都提供了各自的实现,包括Boost::StringRef, LLVM的StringRef, Chromium的base::StringPiece。

(STL也有字串的Copy-on-Write的实现,但要看实现版本。这里有更多的说明:std::string的Copy-on-Write:不如想象中美好。)


以下用StringPiece为例来介绍。它的原理也很简单,StringPiece内部仅持有字串指针和一个长度值,然后参照std::string的接口提供一组操作函数。比如find, find_first_of, rfind, substr. 

  template <typename STRING_TYPE> class BasicStringPiece {
 public:
  ......
  BasicStringPiece substr(size_type pos,
                          size_type n = BasicStringPiece::npos) const {
    return internal::substr(*this, pos, n);
  }

 protected:
  const value_type* ptr_;
  size_type     length_;
};
typedef BasicStringPiece<std::string> StringPiece;

它析构时不会释放字串,因为StringPiece不持有字串的所有权,也就是字串对象本身的生命周期一定要长于StringPiece对象。

可以看到StringPiece是一个模板类,主要是因为它需要同时支持以std::string和C string传递的参数。


以上面提供的取子串的操作为例,一个基本思路就是创建新的StringPiece, 把它的指针指到子串的起始位置,再将长度设定为子串的长度就可以了。在这个过程并没有出现字串的拷贝。

template<typename STR>
BasicStringPiece<STR> substrT(const BasicStringPiece<STR>& self,
                              size_t pos,
                              size_t n) {
  if (pos > self.size()) pos = self.size();
  if (n > self.size() - pos) n = self.size() - pos;
  return BasicStringPiece<STR>(self.data() + pos, n);
}


Enjoy it!



相关文章推荐

操作系统概念(第九章) 虚拟内存

背景第八章所介绍的内存管理算法都是基于一个基本要求:执行指令必须在物理内存中,满足这一要求的第一种方法是整个进程放在内存中。动态载入能帮助减轻这一限制,但是它需要程序员特别小心地做一些额外的工作。指令...

StringPiece

class StringPiece { public:  typedef size_t size_type;  private:  const char*   ptr_;  size_type    ...

base之string_piece

// A string-like object that points to a sized piece of memory. // // Functions or methods may use...
  • kelsel
  • kelsel
  • 2016年07月30日 19:58
  • 523

boost------ref的使用(Boost程序库完全开发指南)读书笔记

boost------ref的使用(Boost程序库完全开发指南)读书笔记

Libuv中文文档之线程

libuv

codevs1099 字串变换 string黑科技+队列

题目链接 : 戳我好歹也是2002年NOIP全国联赛提高组,开始不知道string黑科技,打起来恶心的要死……后来知道了黑科技,打起来真是快,T起来也真是快,不过对于当年数据还是可以的。题目一看,好难...

说说编译链接系统中的符号(symbol)、重定位(relocation)、字串表(string-table)和节(section)

说说编译链接系统中的符号(symbol)、重定位(relocation)、字串表(string-table)和节(section) 作者:liigo日期:2009/11链接:http://blog.c...

string 查询字串

// ConsoleApplication2.cpp : 定义控制台应用程序的入口点。 // #include "stdafx.h" #include "string" #in...

怎么使float保留两位小数或多位小数*如何将整数 int 转换成字串 String

5.怎么使float保留两位小数或多位小数* 两种方法: import java.math.*; …… 方法1: float f = 34.232323; BigDecimal b = ne...

HDU 1708 Fibonacci String(斐波那契字串)

Fibonacci String Time Limit: 3000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:高效操作字串的String Reference类
举报原因:
原因补充:

(最多只允许输入30个字)