有关字符串的复制和分割函数,及这些函数实现要注意的问题
str.h
#ifndef _STR_H
#define _STR_H
#include "stdafx.h"
#include <iostream>
using namespace std;
#define Capacity 10
void str_token();
char* str_cp(char* dest, const char* src);
#endif // !_STR_H
string.cpp
#include "stdafx.h"
#include "str.h"
/*
用分割符将字符串分割,分割符只有一个
*/
void str_token1()
{
char str_sour[Capacity];
char token1[Capacity];
cout << "输入要分割的字符串和分割符(空格分开二者),当被分割的字符串是q时,退出程序:" << endl;
cin >> str_sour >> token1;
bool flag = true;
while (flag)
{
char* result1 = NULL;
result1 = strtok(str_sour, token1);
while (result1 != NULL)
{
cout << result1 << endl;
result1 = strtok(NULL, token1);
}
cin >> str_sour >> token1;
if (!strcmp(str_sour,"q")||!strcmp(str_sour,"Q"))
{
flag = false;
}
}
cout << "Finished" << endl;
}
strtok()函数原型
char* strtok(char s[], const char *delim);
参数s:被分割的字符串,参数delim:分割符
当strtok()在参数s的字符串中发现参数delimiters中包涵的分割符时,则会将该分割符改为\0 字符。在第一次调用时,strtok()必需给予参数str字符串,往后的调用则将参数s设置成NULL。每次调用成功则返回指向被分割出片段的指针。
需要注意的是,使用该函数进行字符串分割时,会破坏被分解字符串的完整,调用前和调用后的s已经不一样了。第一次分割之后,原字符串s变成分割完成之后的第一个字符串,剩余的字符串存储在一个静态变量中,因此多线程同时访问该静态变量时,则会出现错误。
/*
用分割符将字符串分割,分割符有两个
*/
void str_token2()
{
char src[] = "hello world,this is,MAX";
char* result1;
char* result2;
char* buff1;
char* buff2;
char* tmp;
result1 = src;
while ((result1 = strtok_s(result1, ",", &buff1))!=NULL)
{
tmp = result1;
while ((result2 = strtok_s(tmp, " ", &buff2))!=NULL)
{
cout << result2 << endl;
tmp = NULL;
}
result1 = NULL;
}
}
strtok_s函数原型
char *strtok_s( char *strToken, const char *strDelimit, char**context);
改进后的strtok_s增加了一个参数,这个参数context是由调用者提供一个char*指针,strtok_s将每次调用后的字符串位置保存在这个指针中。而之前版本的strtok函数会将这个位置保存在一个函数内部的静态局部变量中,如果有多个线程同时调用这个函数,有可能出现冲突。
/*
字符串复制
*/
char* str_cp(char* dest, const char* src)
{
if (dest == NULL || src == NULL) //(1)
throw "Invalid arguments";
char* dest_cp = dest; //(2)
while ((*dest++ = *src++) != '\0');//(3)
return dest_cp; //(4)
}
错误的做法:
(1)
(A)不检查指针的有效性,说明答题者不注重代码的健壮性。
(B)检查指针的有效性时使用((!strDest)||(!strSrc))或(!(strDest&&strSrc)),说明答题者对C语言中类型的隐式转换没有深刻认识。在本例中char *转换为bool即是类型隐式转换,这种功能虽然灵活,但更多的是导致出错概率增大和维护成本升高。所以C++专门增加了bool、true、false三个关键字以提供更安全的条件表达式。
(C)检查指针的有效性时使用((strDest==0)||(strSrc==0)),说明答题者不知道使用常量的好处。直接使用字面常量(如本例中的0)会减少程序的可维护性。0虽然简单,但程序中可能出现很多处对指针的检查,万一出现笔误,编译器不能发现,生成的程序内含逻辑错误,很难排除。而使用NULL代替0,如果出现拼写错误,编译器就会检查出来。
(2)
(A)return new string("Invalid argument(s)");,说明答题者根本不知道返回值的用途,并且他对内存泄漏也没有警惕心。从函数中返回函数体内分配的内存是十分危险的做法,他把释放内存的义务抛给不知情的调用者,绝大多数情况下,调用者不会释放内存,这导致内存泄漏。
(B)return 0;,说明答题者没有掌握异常机制。调用者有可能忘记检查返回值,调用者还可能无法检查返回值(见后面的链式表达式)。妄想让返回值肩负返回正确值和异常值的双重功能,其结果往往是两种功能都失效。应该以抛出异常来代替返回值,这样可以减轻调用者的负担、使错误不会被忽略、增强程序的可维护性。
(3)
(A)忘记保存原始的strDest值,说明答题者逻辑思维不严密。
(4)
(A)循环写成while (*strDest++=*strSrc++);,同[1](B)。
(B)循环写成while (*strSrc!='\0') *strDest++=*strSrc++;,说明答题者对边界条件的检查不力。循环体结束后,strDest字符串的末尾没有正确地加上'\0'。
(5)
返回strDest的原始值使函数能够支持链式表达式,增加了函数的“附加值”。同样功能的函数,如果能合理地提高的可用性,自然就更加理想。
链式表达式的形式如:
int iLength=strlen(strcpy(strA,strB));
又如:
char * strA=strcpy(new char[10],strB);
返回strSrc的原始值是错误的。其一,源字符串肯定是已知的,返回它没有意义。其二,不能支持形如第二例的表达式。其三,为了保护源字符串,形参用const限定strSrc所指的内容,把const char *作为char *返回,类型不符,编译报错。
main.cpp
// Strtok.cpp: 定义控制台应用程序的入口点。
//
#include "stdafx.h"
#include "str.h"
int main()
{
char src[] = "hello world";
char* dest = new char[sizeof(src)];
dest = str_cp(dest,src);
cout << dest << endl;
str_token1();
str_token2();
delete[] dest;
return 0;
}
(1)
用new操作符申请的空间,要用delete操作符释放