目录
前言
C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在常量字符串中或者字符数组中。
字符串常量 适用于那些对它不做修改的字符串函数.注:在本文中的库函数声明都在cplusplus.com上都可以找到。
函数介绍
strlen
size_t strlen ( const char * str );//求取字符串的长度
- 字符串已经 '\0' 作为结束标志,strlen函数返回的是在字符串中 '\0' 前面出现的字符个数
- 参数指向的字符串必须要以 '\0' 结束。
- 注意函数的返回值为size_t,是无符号的.
库函数的使用:
#include <stdio.h>
#include <string.h>
#include <assert.h>
int main(void)
{
int ret = 0;
char arr[] = "ab cd fe";
ret = strlen(arr);//8
//ret = my_strlen(arr);
printf("%d ", ret);
return 0;
}
模拟库函数的实现:
//size_t strlen ( const char * str );
size_t my_strlen(const char* str)
{
int count = 0;
assert(str);
while (*str++ != 0)
{
count++;
}
return count;
}
长度不受限制的字符串函数
strcpy
char* strcpy(char * destination, const char * source );将源字符串拷贝到目标字符串
- 源字符串必须以 '\0' 结束。
- 会将源字符串中的 '\0' 拷贝到目标空间。
- 目标空间必须足够大,以确保能存放源字符串。
- 目标空间必须可变。
库函数的使用:
#include <stdio.h>
#include <string.h>
#include <assert.h>
int main(void)
{
char arr1[] = "abcdef";
char arr2[20] = { 0 };
strcpy(arr2, arr1);//abcdef
//my_strcpy(arr2,arr1);
printf("%s", my_strcpy(arr2, arr1));
return 0;
}
模拟库函数的实现:
//char* strcpy(char * destination, const char * source );
char* my_strcpy(char* dest, const char* sou)
{
char* fir = dest;
assert(dest && sou);
while (*dest++ = *sou++)
;
*dest = *sou;
return fir;
}
strcat
char * strcat ( char * destination, const char * source );将源字符串追加到目标字符串
- 源字符串必须以 '\0' 结束。
- 目标空间必须有足够的大,能容纳下源字符串的内容。
- 目标空间必须可修改
库函数的使用:
#include <stdio.h>
#include <string.h>
#include <assert.h>
int main(void)
{
char arr2[] = "world";
char arr1[20] = "hello ";
strcat(arr1, arr2);//hello world
//my_strcat(arr1, arr2);
printf("%s",arr1);
return 0;
}
模拟库函数的实现:
//char * strcat ( char * destination, const char * source );
char* my_strcat(char* dest, const char* sou)
{
assert(dest && sou);
char* fir = dest;
while (*dest != 0)
{
dest++;
}
while (*dest++ = *sou++)
{
;
}
*dest = *sou;
return fir;
}
strcmp
int strcmp ( const char * str1, const char * str2 );//字符串的大小比较
- 第一个字符串大于第二个字符串,则返回大于0的数字
- 第一个字符串等于第二个字符串,则返回0
- 第一个字符串小于第二个字符串,则返回小于0的数字
库函数的使用:
#include <stdio.h>
#include <string.h>
#include <assert.h>
int main(void)
{
char arr1[] = "zhengyi";
char arr2[] = "zheng";
int ret = strcmp(arr1, arr2);//>
//int ret = my_strcmp(arr1, arr2);
if (ret < 0)
{
printf("<\n");
}
else if (ret == 0)
{
printf("==\n");
}
else
{
printf(">\n");
}
return 0;
}
模拟库函数的实现:
//int strcmp ( const char * str1, const char * str2 );
int my_strcmp(const char* arr1, const char* arr2)
{
assert(arr1 && arr2);
while (*arr1 == *arr2)
{
if (*arr1 == '\0')
{
return 0;
}
arr1++;
arr2++;
};
//if (*arr1 > *arr2)
//{
// return 1;
//}
//else
//{
// return -1;
//}
//下面这一行是对上述代码的化简
return (*arr1 - *arr2);
}
长度受限制的字符串函数介绍
这里的几个函数与上述的字符串函数并无太大的区别,只是在函数声明时添加了限制,在这里就不模拟实现。
strncpy
char * strncpy ( char * destination, const char * source, size_t num );
- 拷贝num个字符从源字符串到目标空间。
- 如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。
库函数的使用:
#include <stdio.h>
#include <string.h>
int main(void)
{
char arr1[] = "aaaaaaaaaa";
char arr2[] = "zhe";
strncpy(arr1, arr2, 4);
printf("%s",arr1);//zhe
printf("\n");
printf("%d\n", arr1[3]);//0
printf("%s\n", &arr1[4]);//aaaaaa
return 0;
}
strncat
char * strncat ( char * destination, const char * source, size_t num );
库函数的使用:
#include <stdio.h>
#include <string.h>
int main()
{
char arr1[20] = "To be ";
char arr2[20] = "or not to be";
strncat(arr1, arr2, 13);
printf("%s\n", arr1);//To be or not to be
return 0;
}
strncmp
int strncmp ( const char * str1, const char * str2, size_t num );
库函数的使用:
#include <stdio.h>
#include <string.h>
int main()
{
char arr1[20] = "To be ";
char arr2[20] = "or not to be";
int ret = strncmp(arr1, arr2, 13);//<
if (ret < 0)
{
printf("<\n");
}
else if (ret == 0)
{
printf("==\n");
}
else
{
printf(">\n");
}
return 0;
}
字符串查找
strstr
char * strstr ( const char *str1, const char * str2);//该函数可以在目标字符串中查找是否有子串
库函数的使用:
#include <stdio.h>
#include <string.h>
int main()
{
char str[] = "This is a simple string";
char * pch;
pch = strstr(str, "simple");
//pch = my_strstr(str, "simple");
puts(pch);//simple string
return 0;
}
模拟库函数的实现:
char* my_strstr(const char *dest, const char * sou)
{
assert(dest && sou);
const char* det = dest;
const char* so = sou;
const char*p = dest;
while (*p)
{
while ((*det == *so)&&(*det != 0)&&(*so != 0))
{
det++;
so++;
}
if (*so == 0)
{
return p;
}
so = sou;
p++;
det = p;
}
}
strtok
char * strtok ( char * str, const char * sep );
- sep参数是个字符串,定义了用作分隔符的字符集合。
- 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。
- strtok函数找到str中的下一个标记,并将其用 \0 结尾,返回一个指向这个标记的指针。(注:
- strtok函数会改变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)
- strtok函数的第一个参数不为 NULL ,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。
- strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
- 如果字符串中不存在更多的标记,则返回 NULL 指针。
库函数的使用:
#include <stdio.h>
int main()
{
char *p = "abcdefgasd@163.com";
const char* sep = ".@";
char arr[30];
char *str = NULL;
strcpy(arr, p);//将数据拷贝一份,处理arr数组的内容
for (str = strtok(arr, sep); str != NULL; str = strtok(NULL, sep))
{
printf("%s\n", str);
}
//abcdefgasd
//163
//com
}
错误信息报告
strerror
char * strerror ( int errnum );
返回错误码,对应着相关的错误信息
库函数的使用:
#include <stdio.h>
#include <string.h>
#include <errno.h>//必须包含的头文件
int main()
{
FILE * pFile;
pFile = fopen("unexist.ent", "r");
if (pFile == NULL)
printf("Error opening file unexist.ent: %s\n", strerror(errno));
//errno: Last error number
return 0;
}
字符操作
以下的操作都要包含头文件<ctype.h>
字符分类函数
iscntrl | 任何控制字符 |
isspace | 空白字符:空格‘ ’,换页‘\f’,换行'\n',回车‘\r’,制表符'\t'或者垂直制表符'\v' |
isdigit | 十进制数字 0~9 |
isxdigit | 十六进制数字,包括所有十进制数字,小写字母a~f,大写字母A~F |
islower | 小写字母a~z |
isupper | 大写字母A~Z |
isalpha | 字母a~z或A~Z |
isalnum | 字母或者数字,a~z,A~Z,0~9 |
ispunct | 标点符号,任何不属于数字或者字母的图形字符(可打印) |
isgraph | 任何图形字符 |
isprint | 任何可打印字符,包括图形字符和空白字符 |
字符转换:
int tolower ( int c );
int toupper ( int c );
#include <stdio.h>
#include <ctype.h>
int main()
{
int i = 0;
char str[] = "Test String.\n";
char c;
while (str[i])
{
c = str[i];
if (isupper(c))
c = tolower(c);
putchar(c);
i++;
}
//test string.
return 0;
}
内存操作
以上的函数都是用于操作字符串的,但是在我们的编程中还有其他类型的数据类型,下面我们就来介绍内存操作函数(内存函数声明中的num都是值得字节数):
memcpy
void * memcpy ( void * destination, const void * source, size_t num );
- 函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置。
- 这个函数在遇到 '\0' 的时候并不会停下来。
- 如果source和destination有任何的重叠,复制的结果都是未定义的
库函数的使用:
#include <stdio.h>
#include <string.h>
#include <assert.h>
int main(void)
{
int arr1[] = { 1,2,3,4,5,6,7,8,9 };
int arr2[10] = { 0 };
int sz = sizeof(arr1) / sizeof(arr1[0]);
//my_memcpy(arr2, arr1, 36);
memcpy(arr2, arr1, 36);
for (int i = 0; i < sz; i++)
{
printf("%d ",arr2[i]);
}
//1 2 3 4 5 6 7 8 9
return 0;
}
模拟库函数的实现:
//void * memcpy ( void * destination, const void * source, size_t num );
void* my_memcpy(void* dest, const void* sou, size_t num)
{
assert(dest && sou);
void* fir = dest;
while (num-- != 0)
{
*((char*)dest)++ = *((char*)sou)++;
}
return fir;
}
上述的代码可以实现不同内存之间的代码进行拷贝,但是不能实现同一个内存之间的代码拷贝。我们如果使用系统自带的memcpy函数可以发现它也可以是进行同一个内存之间的代码拷贝,这是因为VS编译器对memcpy函数进行了优化。
memmove
void * memmove ( void * destination, const void * source, size_t num );
- 和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。
- 如果源空间和目标空间出现重叠,就得使用memmove函数处理
库函数的使用:
#include <stdio.h>
#include <string.h>
#include <assert.h>
int main(void)
{
int arr1[9] = { 1,2,3,4,5,6,7,8,9 };
int sz = sizeof(arr1) / sizeof(arr1[0]);
memmove(arr1 + 2, arr1, 20);
//my_memmove(arr1 + 2, arr1, 20);
for (int i = 0; i < sz; i++)
{
printf("%d ", arr1[i]);
}
//1 2 1 2 3 4 5 8 9
return 0;
}
模拟库函数的实现:
//void * memcpy ( void * destination, const void * source, size_t num );
void* my_memmove(void* dest, const void* sou, size_t num)
{
assert(dest && sou);
void* fir = dest;
if (dest<sou)
{
while (num-- != 0)
{
*((char*)dest)++ = *((char*)sou)++;
}
return fir;
}
else
{
while (num-- != 0)
{
*((char*)dest + num-1) = *((char*)sou + num-1);
}
return fir;
}
}
memset
void * memset ( void * ptr, int value, size_t num );
库函数的使用:
#include <stdio.h>
#include <string.h>
int main()
{
char str[] = "almost every programmer should know memset!";
memset(str, '-', 6);
puts(str);
return 0;
//------ every programmer should know memset!
}
memcmp
int memcmp ( const void * ptr1,const void * ptr2,size_t num );
比较从ptr1和ptr2指针开始的num个字节
返回值的结果与strcmp相似
#include <stdio.h>
#include <string.h>
int main()
{
char buffer1[] = "DWgaOtP12df0";
char buffer2[] = "DWGAOTP12DF0";
int n;
n = memcmp(buffer1, buffer2, sizeof(buffer1));
if (n > 0)
printf("'%s' is greater than '%s'.\n", buffer1, buffer2);
else if
(n < 0) printf("'%s' is less than '%s'.\n", buffer1, buffer2);
else
printf("'%s' is the same as '%s'.\n", buffer1, buffer2);
return 0;
//'DWgaOtP12df0' is greater than 'DWGAOTP12DF0'.
}