std::string的用法 .

本文主要针对那些有C语言背景知识,而现在开始使用C++语言编程的程序员。事实上,C++继承了大多数C语言的功能,但有些方面还是不得不要留意的,如new和delete取代了malloc和free,且C++还使用了STL容器类来静态或动态地分配数组。本文中要讲的是用std::string来取代char*,将会演示C风格数组带来的一系列问题,及如何使用std::string来避免这些问题。


避免“病态”的char数组声明

当声明一个char数组时,许多程序员都会这样做:


char* name = "marius";


乍看起来好像没什么问题,但如果想让字符串首字符大写,最简单的实现方法是:


name[0] = 'M';


代码生成时没有问题,但在运行时会崩溃,因为这是未定义的行为,且依赖于编译器的实现(在VS2005中,可通过编译,但在运行时会崩溃)。对此的解答是:“marius”是一个文字上的字符串,且存储于程序的数据区,“name”只是一个指向数组的指针,因为存储字符串的数据区为只读,所以不允许你修改它。正确的声明形式应该像下面这样:


const char* name = "marius";


这样一来,只要试图修改其中的一个字符,都会被编译器发现,并抛出一个错误:cannot modify a constant variable。


“令人讨厌”的C风格方法

可用char[]来定义一个定长的字符数组:


char name[] = "marius";
name[0] = 'M';


在本例中,name是一个7字符的数组(包括终止符),其由字符串“marius”进行初始化,具有读写权限。
现在,试着用strcat()衔接一个字符串:


char name[] = "marius";
strcat(name, " bancila");


但程序只要一运行就会崩溃,因为strcat不能确定缓冲区是否可以装下追加的字符串,导致数组越界破坏了内存。
当然了,你也可声明一个更大的数组来解决这个问题,只要保证它能放下所有的字符就行了,比如说,50个字符长度应该可以放下一个英文名了:


char name[50] = "marius";
strcat(name, " bancila");


这就行了,但如果有Carlos Marìa Eduardo García de la Cal Fernàndez Leal Luna Delgado Galván Sanz这样的名字呢,而且这只是单个西班牙名,另外还有内存空间浪费的问题,如果声明了100个字符长度,平均使用只有20,那一份十万个名字的列表,要浪费800万字节了。


动态分配内存

那么接下来就是寻找动态分配内存最合适的方法:


char* name = new char[strlen("marius")+1];
strcpy(name, "marius");


在此例中,你可重新分配所需的内存,如下所示:


char* temp = new char[strlen(name) + strlen(" bancila") + 1];
strcpy(temp, name);
strcat(temp, " bancila");

delete [] name;
name = temp;


这需要编写及维护更多的代码,另外,在涉及到类时,情况会变得更加复杂。


确保类中内存的正确处理

如果有一个Person类,它存储了人名,你的第一个反应它可能会像下面这样:


class Person
{
char* name;
};


好像看上去没什么问题,但这个类还应有:

? 一个构造函数,它可以接受一个字符串来初始化name;
? 一个自定义的拷贝构造函数,以确保深拷贝(默认的拷贝构造函数由编译器提供,它是浅拷贝,也就是说,当从一个对象中复制全部属性的值到一个对象时,它只复制了指针,而不是指向的所有对象)。
? 一个自定义的 operator=
? 一个析构函数,负责清理动态分配的内存


把这些整合起来之后,Person类就会像下面这样:


class Person
{
char* name;
public:
Person(const char* str)
{
name = new char [strlen(str)+1];
strcpy(name, str);
}

Person(const Person& p)
{
name = new char [strlen(p.name)+1];
}

Person& operator=(const Person& p)
{
if(this != &p)
{
delete [] name;

name = new char [strlen(p.name)+1];
strcpy(name, p.name);
}

return *this;
}

~Person()
{
delete [] name;
}
};


还是std::string省事

标准模板库(STL)提供了一个std::string类,其是std::basic_string的一个特化,它是一个容器类,可把字符串当作普通类型来使用,并支持比较、连接、遍历、STL算法、复制、赋值等等操作,这个类定义在<string>头文件中。

使用std::string的好处在于:

1、 易于分配、复制及连接。

std::string name = "marius";  // 由赋值进行初始化
name += " bancila";           // 连接
std::string copy = name;      // 复制


2、 可用length()或size()方法确定字符串的长度,这两个方法是一样的,第二个方法只是为了保持STL容器类的一致性。

std::string name = "marius";
std::cout << "length=" << name.length() << std::endl;
std::cout << "length=" << name.size()   << std::endl;


3、 检查是否为空值。

std::string name;
if(name.empty())
std::cout << "empty string";


4、 支持比较。

if(name == "marius")
{
}

if(name.compare("marius") == 0)
{
}
方法campre进行大小写敏感的比较,以确定两个字符串是否相等,或其中一个在词典顺序上小于另一个。它的返回值与strcmp()的返回值代表的意义一样:负值表示操作数小于参数字符串,而正值表示操作系统数大于它,0表示相等。另外,还有6个重载版本可允许比较字符串的某一部分:


if(name.compare(0, 3, "mar") == 0)
{
std::cout << "match";
}


5、 重载操作符 << 和 >>,可从流中读写字符串。

std::string name;
std::cin  >> name;    // 从控制台中读name
std::cout << name;    // 向控制台写name


6、 易于访问字符串中的字符。

std::string name = "marius";
name[0] = 'M';
name[name.length()-1] = 'S';


7、 遍历所有字符,这可由C风格的索引或STL迭代子来完成(如果无需修改,应使用const_iterator)。

std::string name = "marius";

for(size_t i = 0; i < name.length(); ++i)
std::cout << name[i];

for(std::string::const_iterator cit = name.begin(); cit != name.end(); ++cit)
std::cout << *cit;

for(std::string::iterator it = name.begin();it != name.end(); ++it)
*it = toupper(*it);


8、 删除字符串的某一部分。

std::string name = "marius bancila";
// 删除第6个元素之后的所有东西
name.erase(6, name.length() - 6);


9、 在指定位置插入字符串或字符。

std::string name = "marius";
// 在结尾插入
name.insert(name.length(), " bancila");
name.insert(name.length(), 3, '!');


10、在字符串结尾插入其他元素。

std::string name = "marius";
name.push_back('!');


11、两个字符串值的快速交换。

std::string firstname = "bancila";
std::string lastname = "marius";
firstname.swap(lastname);

std::cout << firstname << ' ' << lastname << std::endl;


12、使用c_str()方法只读访问其内部字符数组缓冲区,可在接受字符指针(是否const都行)作参数的函数中使用std::string对象。

void print(const char* name)
{
std::cout << name << std::endl;
}

std::string name = "marius";
print(name.c_str());

void makeupper(char* array, int len)
{
for(int i = 0; i < len; ++i)
array[i] = toupper(array[i]);
}

std::string name = "marius";
makeupper(&name[0], name.length());


13、使用STL算法

std::string name = "marius";
// 使字符串全为大写
std::transform(name.begin(), name.end(), name.begin(),toupper);
std::string name = "marius";
// 升序排列字符串
std::sort(name.begin(), name.end());
std::string name = "marius";
// 反转字符串
std::reverse(name.begin(), name.end());
bool iswhitespace(char ch)
{
return  ch == ' ' || ch == '/t' || ch == '/v' ||
ch == '/r' || ch == '/n';
}

std::string name = " marius  ";
// 删除空白字符
std::string::iterator newend = std::remove_if(name.begin(), name.end(), iswhitespace);
name.erase(newend);


14、也可用头文件<sstream>中的std::stringstream来构建字符串。

std::stringstream strbuilder;
strbuilder << "1 + 1 = " << 1+1;
std::string str = strbuilder.str();


来回顾一下前面的Person类,如果用std::string替换了char*,那么剩下的工作只需编写一个构造函数就行了,其他的由编译器来完成,在本例中,复制字符串时使用了浅拷贝,这足够了,因为这个动作触发了std::string的operator=,它会正确地复制字符串。


class Person
{
std::string name;
public:
Person(const std::string& str)
{
name = str;
}
};

Person p1("marius");
// works because std::string has a constructor that takes a const
// char*

Person p2("bancila");
p1 = p2;


结论

本文既不是std::string的文档,也不是其辅导书,只是恳求大家使用std::string。用标准模板库中的std::string来取代C风格数组可使代码看上去更简洁、更自然、更易于阅读及维护,也不必担心动态内存分配等问题,由此可忽略一些不必要的细节问题(如内存管理),而集中精力于编程的重要方面,试下吧。

### 回答1: 你可以使用C++标准库提供的函数来将std::string转换为std::u32string。可以使用std::codecvt_utf8<char32_t>转换器来实现。下面是一个简单的示例代码: ``` #include <locale> #include <string> std::string input = "Hello world!"; std::wstring_convert<std::codecvt_utf8<char32_t>, char32_t> converter; std::u32string output = converter.from_bytes(input); ``` 首先,我们将要转换的std::string存储在input变量中。然后,我们使用std::codecvt_utf8<char32_t>来创建一个转换器。接下来,我们使用std::wstring_convert类的from_bytes()函数将input转换为std::u32string类型的output。 请注意,这需要使用C++11或更高版本的编译器。 ### 回答2: 要将std::string转换为std::u32string,可以使用std::wstring_convert类的两个模板参数,分别表示源字符串类型和目标字符串类型。首先,我们需要一个std::wstring_convert对象,并传入std::codecvt_utf8<char32_t>作为转换器类型。 接下来,我们可以使用该对象的to_bytes()方法将std::string转换为std::wstring,然后再将std::wstring转换为std::u32string。这样可以确保字符编码的正确性。最后,将结果存储在std::u32string对象中。 示例代码如下: ```cpp #include <locale> #include <codecvt> #include <string> std::u32string convertToU32String(const std::string& str) { std::wstring_convert<std::codecvt_utf8<char32_t>, char32_t> converter; std::wstring intermediate = converter.from_bytes(str); return std::u32string(intermediate.begin(), intermediate.end()); } int main() { std::string sourceString = "Hello, 世界!"; std::u32string targetString = convertToU32String(sourceString); return 0; } ``` 通过以上代码,我们可以将std::string类型的sourceString转换为std::u32string类型的targetString。注意,在编译时,需要确保使用了正确的编码格式,比如UTF-8。这样,我们就成功地完成了std::stringstd::u32string的操作。 ### 回答3: std::string是C++标准库中表示字符串的数据类型,而std::u32string是表示使用UTF-32编码的字符串的数据类型。要将std::string转换为std::u32string,我们可以使用一些转换函数和库函数来完成。 首先,我们需要包含<string>和<codecvt>头文件来访问相关函数和库函数。然后,我们可以使用std::wstring_convert类来完成字符串转换。 下面是一个示例代码,展示了如何将std::string转换为std::u32string: ```cpp #include <string> #include <codecvt> std::u32string stringToU32String(const std::string& str) { std::wstring_convert<std::codecvt_utf8<char32_t>, char32_t> converter; std::u32string u32str = converter.from_bytes(str); return u32str; } int main() { std::string str = "Hello, World!"; std::u32string u32str = stringToU32String(str); return 0; } ``` 在上面的代码中,我们定义了一个名为stringToU32String的函数,它接受一个std::string类型的参数str,并将其转换为std::u32string类型。在这个函数中,我们使用std::wstring_convert类及其模板参数std::codecvt_utf8<char32_t>来执行转换操作。这个转换过程会使用UTF-8编码的字符串作为中间步骤来处理。 最后,我们在main函数中调用stringToU32String函数,并将std::string类型的字符串"Hello, World!"转换为std::u32string类型。转换后的字符串存储在u32str变量中。 需要注意的是,上述代码中使用的方法需要依赖C++11及以上的标准。如果使用的是更早版本的C++标准,可能需要使用其他方法来进行字符串转换。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值