今天的不开心就到此结束吧,明天依然光芒万丈喔,宝贝~
这里是小bang子,今天我给大家讲一下字符串函数还有内存操作函数。希望大家多多支持!
目录
01前言
02求字符串长度
-
🔖strlen
size_t strlen ( const char * str );
- 字符串已经 '\0' 作为结束标志,strlen函数返回的是在字符串中 '\0' 前面出现的字符个数(不包含 '\0' )。
- 参数指向的字符串必须要以 '\0'结束。
- 注意函数的返回值为size_t,是无符号的( 易错 )
strlen模拟:我使用的是最简单的计数器方法
size_t my_strlen(const char* str)
{
int count = 0;
assert(str != NULL);
while (*str != '\0')
{
count++;
str++;
}
return count;
}
实现模拟还有指针-指针或者递归的方式,大家下去可以尝试尝试。
03长度不受限制的字符串函数
-
🔖strcpy
拷贝字符串:将源字符串内容拷贝到目标字符串
char* strcpy(char * destination, const char * source );
- 源字符串必须以 '\0' 结束。
- 会将源字符串中的 '\0' 拷贝到目标空间。
- 目标空间必须足够大,以确保能存放源字符串。
- 目标空间必须可变
可以看到'\0'也拷贝了过去。
若源字符串不带'\0'则会报错。
搜索不到'\0'无法结束,数组越界报错。
strcpy只是复制字符串,但不限制复制的数量。很容易造成缓冲溢出,也就是说,无论dest有没有足够的空间来容纳src的字符串,它都会把src指向的字符串全部复制到dest。所以我们要保障dest的空间足够大。
模拟strcpy:
char* my_strcpy(char*dest, const char* src)
{
assert(src && dest);
char* ret = dest;
while(*dest++ = *src++)
{
;
}
return ret;
}
-
🔖strcat
追加字符串: 将源字符串内容追加到目标字符串后,从目标字符串的'\0'处追加。
char * strcat ( char * destination, const char * source );
- 源字符串必须以 '\0' 结束。
- 目标空间必须有足够的大,能容纳下源字符串的内容。
- 目标空间必须可修改。
模拟strcat:用ret指向字符串首地址,返回。
char* my_strcat(char* dest, char* src)
{
assert(dest && src);
char* ret = dest;
//找目标空间中的\0
while (*dest)
{
dest++;
}
//拷贝
while (*dest++ = *src++)
{
;
}
return ret;
}
-
🔖strcmp
比较字符串:从字符串首字符开始比较,比较ASCII码值,若相同后面的字符继续比较,直到不同返回数字。
int strcmp ( const char * str1, const char * str2 );
Value | Relationship of string1 to string2 |
< 0 | string1 less than string2 |
0 | string1 identical to string2 |
> 0 | string1 greater than string2 |
模拟strcmp:
int my_strcmp(const char* s1, const char* s2)
{
assert(s1 && s2);
while (*s1 == *s2)
{
if (*s1 == '\0')
{
return 0;//相等
}
s1++;
s2++;
}
//不相等
return *s1 - *s2;
}
04长度受限制的字符串函数
-
🔖strncpy
char * strncpy ( char * destination, const char * source, size_t num );
与strcpy区别在于,指定拷贝的长度,若源字符串不够指定长度,后续拷贝0。
-
🔖strncat
char * strncat ( char * destination, const char * source, size_t num );
同strcat操作,指定追加字符串的长度。
-
🔖strncmp
int strncmp ( const char * str1, const char * str2, size_t num );
同strcmp操作比较到出现另个字符不一样或者一个字符串结束或者num个字符全部比较完。
05字符串查找
-
🔖strstr
查找子串:
char * strstr ( const char *str1, const char * str2);
- 返回一个指针,指向字符串中第一次出现的子串,如果子串没有出现在字符串中,则返回NULL。
我们来看看运行结果:
int main()
{
char str[] = "abcdefbcdefgh";
char str2[]="cde";
char* ret = strstr(str, str2);
if (ret == NULL)
{
printf("没找到\n");
}
else
printf("%s\n", ret);
return 0;
}
究竟如何实现的查找子串的操作,我们来模拟讲解讲解:
char* my_strstr(const char* str1, const char* str2)
{
assert(str1 && str2);
const char* s1 = str1;
const char* s2 = str2;
const char* cur = str1;
while (*cur)
{
s1 = cur;
s2 = str2;
while (*s1 && *s2 && (*s1 == *s2))
{
s1++;
s2++;
}
if (*s2 == '\0')
{
return (char*)cur;
}
cur++;
}
return NULL;//找不到
}
首先需要s1,s2指针来进行串内查找,cur指针标记主串当前查找位置。
查找成功:
向后进行查找,如果查找到s2的第一个字符则s1,s2继续向后比对,如果s2指向'\0'代表查找成功,主串中有子串,若比对过程中s1与s2不相当,则退出比对,cur++,从主串下一个字符开始查找,s1指向当前查找位置,s2移回子串首字符。
查找失败:
cur指向主串结束符,退出循环返回NULL。
-
🔖strtok
分割字符串
char * strtok ( char * str, const char * sep );
- sep参数是个字符串,定义了用作分隔符的字符集合
- 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。
strtok 函数找到 str 中的下一个标记,并将其 用\0 结尾 ,返回一个指向这个标记的指针。(注: strtok函数会改变被操作的字符串 ,所以在使用 strtok 函数切分的字符串一般都是临时拷贝的内容并且可修改。)
- strtok函数的第一个参数不为 NULL ,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。
- strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
- 如果字符串中不存在更多的标记,则返回 NULL 指针。
#include <stdio.h>
int main()
{
char *p = "zhangpengwei@bitedu.tech";
const char* sep = ".@";
char arr[30];
char *str = NULL;
strcpy(arr, p);//将数据拷贝一份,处理arr数组的内容
for(str=strtok(arr, sep); str != NULL; str=strtok(NULL, sep))
{
printf("%s\n", str);
}
}
看看调试过程,将标记替换成\0,再从保存位置处继续查找标记。
很巧妙使用for循环实现自动分割次数的操作。
06错误信息报告
-
🔖strerror
char * strerror ( int errnum );
返回错误码,所对应的错误信息。
如果程序有错误码,则通过
printf("%s\n,strerror(错误码))
打印出错误信息。
07字符分类函数
函数
|
如果他的参数符合下列条件就返回真
|
iscntrl
|
任何控制字符
|
isspace
|
空白字符:空格
‘ ’
,换页
‘\f’
,换行
'\n'
,回车
‘\r’
,制表符
'\t'
或者垂直制表符
'\v'
|
isdigit
|
十进制数字
0~9
|
isxdigit
|
十六进制数字,包括所有十进制数字,小写字母
a~f
,大写字母
A~F
|
islower
|
小写字母
a~z
|
isupper
|
大写字母
A~Z
|
isalpha
|
字母
a~z
或
A~Z
|
isalnum
|
字母或者数字,
a~z,A~Z,0~9
|
ispunct
|
标点符号,任何不属于数字或者字母的图形字符(可打印)
|
isgraph
|
任何图形字符
|
isprint
|
任何可打印字符,包括图形字符和空白字符
|
08内存操作函数
-
🔖memcpy
void * memcpy ( void * destination, const void * source, size_t num );
- 函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置。
- 这个函数在遇到 '\0' 的时候并不会停下来。
- 如果source和destination有任何的重叠,复制的结果都是未定义的。
假设数组数据是1,2,3,4,5,6,7,8,9;先在将1234拷贝到5678。我们画图讲解:
在内存中是小端字节序存储,我们展开来看:
与qsort一样,都是通过一个一个字节来实现数据的变换。
值得注意的是:memcpy本来是不具备拷贝重叠空间的情况,所以我在模拟的时候并没有考虑占据重叠空间,但在后续的函数改进中,memcpy现在具备了处理占据重叠空间的能力。
模拟memcpy
void* my_memcpy(void* dest, void* scr, size_t count)
{
assert(dest && scr);
void* res = dest;
while (count--)
{
*(char*)dest = *(char*)scr;
dest = (char*)dest + 1;
scr = (char*)scr + 1;
}
return res;
}
强制转换成 char * 类型访问1个字节,以字节进行复制,再用1个指针返回目的地的起始地址。
-
🔖memmove
void * memmove ( void * destination, const void * source, size_t num );
- 和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。
- 如果源空间和目标空间出现重叠,就得使用memmove函数处理。
memmove因为要处理重叠内存块所以,要分情况讨论拷贝方式:
重叠情况如果不用从后往前,而用从前往后则会出现错误:如下图
模拟memmove
void* my_memmove(void* dest, void* scr, size_t count)
{
assert(dest && scr);
void* res = dest;
if (dest < scr)
{ //前->后
while (count--)
{
*(char*)dest = *(char*)scr;
(char*)dest+=1;
(char*)scr+=1;
}
}
else
{
//后->前
while (count--)
{
*((char*)dest+count) = *((char*)scr+count);
}
}
return res;
}
-
🔖memset
内存设置——memset
void * memset( void * destination, int c, size_t num);
从目标地址开始操作num个字节,设置成c。
我们查看内存看看是否是这样设置字节:
-
🔖memcmp
int memcmp ( const void * ptr1, const void * ptr2, size_t num );
比较从ptr1和ptr2指针开始的num个字节 。
Return Value | Relationship of First count Bytes of buf1 and buf2 |
< 0 | buf1 less than buf2 |
0 | buf1 identical to buf2 |
> 0 | buf1 greater than buf2 |
我们写段程序验证下:
int main()
{
char buffer1[] = "DWgaOtP12df0";
char buffer2[] = "DWGAOTP12DF0";
int n;
n = memcmp(buffer1, buffer2, sizeof(buffer1));
if (n > 0) printf("'%s' is greater than '%s'.\n", buffer1, buffer2);
else if (n < 0) printf("'%s' is less than '%s'.\n", buffer1, buffer2);
else printf("'%s' is the same as '%s'.\n", buffer1, buffer2);
return 0;
}
比较到第三个字符时,'g'的ASCII码比'G'的大返回>0。
以上就是本次字符串函数和内存函数的讲解,希望对大家有所帮助,谢谢!