字符函数和字符串函数
前言:
C语言中对字符和字符串的处理很是频繁,但是C语言本身是没有字符串类型的,字符串通常放在 常量字符串中或者字符数组中。 字符串常量 适用于那些对它不做修改的字符串函数.
1.长度不受限制的字符串函数
长度不受限制的字符串相对来说不够安全。
strcpy
char* strcpy(char * destination, const char * source );
- 源字符串必须以 ‘\0’ 结束。
- 会将源字符串中的 ‘\0’ 拷贝到目标空间。
- 目标空间必须足够大,以确保能存放源字符串。
- 目标空间必须可变。
strcat
char * strcat ( char * destination, const char * source );
- 源字符串必须以 ‘\0’ 结束。
- 目标空间必须有足够的大,能容纳下源字符串的内容。
- 目标空间必须可修改。
//模拟实现strcat
#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include<assert.h>
//strcat返回的是目标空间的起始地址
char* my_strcat(char* dest, const char* src)
{
assert(dest && src);
//1.找到目标字符串的末尾
while (*dest)
dest++;
//2.追加源字符串直到\0
while (*dest++ = *src++)
;
}
int main()
{
char arr1[20] = "abc";
char arr2[] = {'d','e','f','\0'};
//strcat(arr1, arr2);
my_strcat(arr1, arr2);
printf("%s\n", arr1); //abcdef
return 0;
}
strcmp
int strcmp ( const char * str1, const char * str2 );
- 第一个字符串大于第二个字符串,则返回大于0的数字 。
- 第一个字符串等于第二个字符串,则返回0 。
- 第一个字符串小于第二个字符串,则返回小于0的数字 。
//模拟实现
#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include<assert.h>
int my_strcmp(char* s1, const char* s2)
{
assert(s1 && s2);
while (*s1 == *s2)
{
if (*s1 == '\0')
return 0;
s1++;
s2++;
}
return *s1 - *s2;
}
int main()
{
//strcmp 是比较字符串的,比较的是字符串的内容,不是长度
char arr1[] = "abcdef";
char arr2[] = "abq";
// int ret=strcmp(arr1, arr2);
int ret = my_strcmp(arr1, arr2);
if (ret == 0)
printf("=\n");
else if (ret < 0)
printf("<\n");
else
printf(">\n");
printf("\n%d\n", ret);
return 0;
}
2. 长度受限制的字符串函数
strncpy
char * strncpy ( char * destination, const char * source, size_t num);
- 拷贝num个字符从源字符串到目标空间。
- 如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。
#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include<assert.h>
int main()
{
char arr1[20] = "abcdefghi";
char arr2[] = "xxx";
strncpy(arr1, arr2, 6);
printf("%s\n", arr1);
return 0;
}
strncmp
int strncmp ( const char * str1, const char * str2, size_t num );
- 比较到出现另个字符不一样或者一个字符串结束或者num个字符全部比较完。
- 在给定长度内,第一个字符串大于第二个字符串,则返回大于0的数字 。
- 在给定长度内,第一个字符串等于第二个字符串,则返回0 。
- 在给定长度内,第一个字符串小于第二个字符串,则返回小于0的数字 。
#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
int main()
{
char arr1[] = "abcwef";
char arr2[] = "abcqw";
int ret = strncmp(arr1, arr2, 4);
printf("%d\n", ret);
return 0;
}
strncat
char * strncat ( char * destination, const char * source, size_t num );
用于在原字符串的末尾追加指定长度的字符串,并返回原字符串地址。
//模拟实现
#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include<assert.h>
char* my_strncat(char* arr1, const char* arr2, size_t count)
{
assert(arr1 && arr2);
char* pf = arr1;
while (*arr1)
arr1++;
while (*(char*)arr1++ = *(char*)arr2++)
;
return pf;
}
int main()
{
char arr1[20] = "abc\0xxxxxx";
char arr2[] = "def";
//strncat(arr1, arr2, 6);
my_strncat(arr1, arr2, 6);
printf("%s\n", arr1);
return 0;
}
3. 字符串查找函数
strstr
char * strstr ( const char *, const char * );
用于在一个字符串中查找一个子串,并返回第一次查找到的位置。
//模拟实现
#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include<assert.h>
char* my_strstr(const char* str1, const char* str2)
{
assert(str1 && str2);
char* s1;
char* s2;
char* cp=str1;
if (*str2 == '\0')
return str1;
while (*cp)
{
s1 = cp;
s2 = str2;
while (*s2!='\0' && *s1!='\0' && *s1 == *s2)
{
s1++;
s2++;
}
if (*s2 == '\0')
{
return cp;
}
cp++;
}
//找不到
return NULL;
}
int main()
{
char arr1[] = "i am a good student,hehe student";
char arr2[] = "student";
//查找arr1中arr2第一次出现的位置
//char* ret = strstr(arr1, arr2);
char* ret = my_strstr(arr1, arr2);
if (ret == NULL)
{
printf("找不到\n");
}
else
{
printf("%s\n", ret);
}
return 0;
}
此时可参考KMP算法,实现我们平时常说的关键字搜索 。
strtok
char * strtok ( char * str, const char * sep );
- sep参数是个字符串,定义了用作分隔符的字符集合 。
- 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。
- strtok函数找到str中的下一个标记,并将其用 \0 结尾,返回一个指向这个标记的指针。(注:strtok函数会改变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)
- strtok函数的第一个参数不为 NULL ,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。
- strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
- 如果字符串中不存在更多的标记,则返回 NULL 指针。
#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include<assert.h>
int main()
{
char arr1[] = "apw@bitedu.tech";
char arr2[100] = { 0 };//临时数据
char sep[] = "@.";
strcpy(arr2, arr1);
char* ret = NULL;
//分割字符串
/*strtok(arr2,sep);
strtok(NULL, sep);*/
for (ret = strtok(arr2, sep); ret != NULL; ret = strtok(NULL, sep))
{
printf("%s\n", ret);
}
return 0;
}
4. 内存操作函数
memcpy
void * memcpy ( void * destination, const void * source, size_t num);
- 函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置。
- 这个函数在遇到 ‘\0’ 的时候并不会停下来。
- 如果source和destination有任何的重叠,复制的结果都是未定义的。
#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include<assert.h>
void* my_memcpy(void* dest, const void* src, size_t count)
{
void* ret = dest;
assert(dest && src);
while (count--)
{
*(char*)dest = *(char*)src;
dest = (char*)dest + 1;
src = (char*)src + 1;
}
return ret;
}
int main()
{
int arr1[10] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 };
int arr2[20] = { 0 };
//拷贝的是整形数据
//memcpy(arr2, arr1, 10 * sizeof(int));
//memcpy - 只要完成了不重叠的内存拷贝就完成任务
//内存拷贝时,出现内存重叠现象时,应使用memmove
my_memcpy(arr2, arr1, 10 * sizeof(int));
int i = 0;
for (i = 0; i < 20; i++)
{
printf("%d ", arr2[i]);
}
return 0;
}
memmove
void * memmove ( void * destination, const void * source, size_t num );
-
和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。
-
如果源空间和目标空间出现重叠,就得使用memmove函数处理。
#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include<assert.h>
void* my_memmove(void* dest, const void* src, size_t count)
{
void* ret = dest;
assert(dest && src);
if (dest < src)
{
//前->后
while (count--)
{
*(char*)dest = *(char*)src;
dest=(char*)dest + 1;
src=(char*)src + 1;
}
}
else
{
//后->前
while (count--)
{
*((char*)dest+count) = *((char*)src+count);
}
}
return ret;
}
int main()
{
int arr[10] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 };
my_memmove(arr, arr+2, 16);
for (int i = 0; i < 10; i++)
printf("%d ", arr[i]);
return 0;
}
VS编译器下,memcpy和memmove可以实现一样的功能。
memcmp
int memcmp ( const void * ptr1, const void * ptr2, size_t num );
比较从ptr1和ptr2指针开始的num个字节 。
#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include<assert.h>
int main()
{
int arr1[] = { 1, 2, 3, 4, 5};
int arr2[] = { 1, 2, 3, 6, 6 };
int ret = memcmp(arr1, arr2, 13);
printf("%d\n", ret);
return 0;
}
memset
void *memset( void *dest, int c, size_t count );
#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
int main()
{
int arr[] = { 1, 2, 3, 4, 5, 6 };
memset(arr, 0, 24);
for (int i = 0; i < 6;i++)
printf("%d ", arr[i]);
return 0;
}
5. 错误信息报告
strerror
char * strerror ( int errnum );
返回错误码,所对应的错误信息。
#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include<string.h>
#include<errno.h>
//int main()
//{
// printf("%s\n", strerror(0)); //No error
// printf("%s\n", strerror(1)); //Operation not permitted
// printf("%s\n", strerror(2)); //No such file or directory
// printf("%s\n", strerror(3)); //No such process
// return 0;
//}
//C语言库函数调用失败的时候
//会把错误码,存储到errno变量中
int main()
{
FILE* pf = fopen("test.txt", "r");
//errno - 全局变量
//strerror - 可以返回c语言内置的错误码对应的错误信息
if (pf == NULL)
{
//printf("%s\n", strerror(errno));
perror("测试"); //打印+strerror
}
else
{
printf("打开文件成功。\n");
}
return 0;
}
字符分类函数:
函数 | 如果他的参数符合下列条件就返回真 |
---|---|
iscntrl | 任何控制字符 |
isspace | 空白字符:空格‘ ’,换页‘\f’,换行’\n’,回车‘\r’,制表符’\t’或者垂直制表符’\v’ |
isdigit | 十进制数字 0~9 |
isxdigit | 十六进制数字,包括所有十进制数字,小写字母af,大写字母AF |
islower | 小写字母a~z |
isupper | 大写字母A~Z |
isalpha | 字母az或AZ |
isalnum | 字母或者数字,az,AZ,0~9 |
ispunct | 标点符号,任何不属于数字或者字母的图形字符(可打印) |
isgraph | 任何图形字符 |
isprint | 任何可打印字符,包括图形字符和空白字符 |