strlen()
c语言没有字符串类型,所以需要 <string.h>
strlen()求字符串长度,直到\0,没有\0结果是随机值
char arr[] = {'a', 'b', '\0'};
strlen(arr)== 2
因为\0是终止符,
**注意:**两个strlen()相减,结果为无符号,无符号数相减结果-3,仍然是无符号,会被理解为非常大的无符号数,值大于0,输出>
- 重写strlen()函数:
strlen()返回类型是size_t, 无符号数,但为什么不用unsigned int?
size_t比unsigned int范围更大:
size_t可能代表以下五种中一种:
unsigned char
unsigned short
unsigned int
unsigned long
unsigned long long
重写strlen()
size_t mystr_len(const char* str)
{
int count = 0;
// 害怕str为空指针
assert(str != NULL);
while (*str != '\0')
{
count++;
str++;
}
return count;
}
strcpy()专门的字符串拷贝函数
必须保证源字符串中有\0
- strcpy()会把\0也拷贝过去
- 如果字符串数组中初始化使用【size】给值,未使用字符空间会隐藏\0,即strcpy()可以正常使用。要保证目标空间足够大,确保能放进去,否则直接报错。要保证目标空间长度可变可修改:
如果dest char* arr1 = “qweraa”,则它指向了常量字符串,常量是不可修改的。
- 非常好的实现
void my_strcpy(char* dest, const char* src)
{
// 传入错误值报错
assert(dest && src);
// 即使最后是\0,也会先赋值,拷贝成功后整体变为0,也会使得while停
while (*dest++=*src++)
{;}
}
标准的my_strcpy()会返回目标空间起始地址,所以起始时候拿char* res = dest; 再 return res;
strcat()
源字符串必须以\0结尾,会追加到\0位置上
如果字符串显示有\0且后面还跟着别的字符,结果会使得第一个\0后跟着被追加的值,src中后面的字符可能丢掉。
如果初始化不指定大小,且不显示给\0 就不能使用
手写strcat()思路:
- 寻找\0,然后操作和strcpy()一样
char* my_strcat(char* dest, char* src)
{
assert(dest && src);
char* res = dest;
// 寻找\0位置,解引用为\0才停止
while (*dest)
{
dest++;
}
// copy
while (*dest++ = *src++)
{
;
}
return res;
}
这里的res虽然是临时指针变量,但是它指向的空间,是外面int main()开辟过的,返回的res是个地址值,而且是被开辟过的,但是如果你返回一个临时数组,调用函数结束后,内存会回收这个空间,所以返回数组是错误的做法。
- 我现在不喜欢返回临时变量,但是这里只是为了返回一个值,外面拿东西接收地址就行。
- 如果自己追加给自己,肯定不行,它永远没有了\0,一直在往后,会出错。
strcmp():字符串比较大小
比较字符串对应位置字符大小,按字典序,相同向后比
返回是: <0、==0、>0
自己在main()中判断
int my_strcmp(const char* s1, const char* s2)
{
// 小心写错,内部可以写与:&&,与运算符是&&
assert(s1&&s2);
while (*s1 == *s2) // 先走到两个不等的位置
{
if (*s1 == '\0')
{
return 0; // 相等
}
s1++;
s2++;
}
if (*s1 > *s2)
return 1;
else
return -1;
}
巧妙写法:
while出去后,return *s1-*s2;
临时插入笔记: strcpy()使用一定要注意能不能放下
如下代码会报错,因为arr1未初始化,会开辟刚刚好的空间,arr2过大
char arr1[] = "abc";
char arr2[] ="abcdef";
strcpy(arr1, arr2); 会报错
这个strcpy拷贝没有长度限制
长度受限制的字符串函数:需要明确拷贝、追加、比较的长度
strncpy()
strncat()
strncmp()
strncpy(arr1, arr2, 3)
只把arr2中的前3个字符给arr1,arr1中剩下的还会保留
strncat()控制字符串追加数量
arr追加给arr1,不要超过3,写5它也只能追加3个。
自己给自己追加也行
strncmp():选择个数做字符串比较
char arr1[] = “abcde”;
char arr2[] = “qwerty”;
int ret = strncmp(arr1, arr2, 4);
只比较前4个,会得到0
插入知识点:直接比较字符串和字符数组:
- 两个字符数组比较,比较的不是内容,arr1和arr2代表数组首元素地址,肯定不一样,因为两个数组的地址不同
- 第二个:两个常量字符串比较,比较的也不是内容,而是两个常量字符串的地址
- 第三个: char* p = “abcde”;
这里不是把常量字符串值给了p,而是把地址给了p,你的p类型本来就是个指针,本来也不可能接收常量字符串的值,肯定是地址。
strstr():判断子串str2在str1中的位置,不存在返回null
char* strstr(const char* str1, const char* str2)
char* ret = strstr(arr1, arr2);
返回的是地址。判读返回地址是不是NULL
strstr()模拟实现
字符串比较,最逊的写法:
// 需要开始匹配的位置
char* my_strstr(char* str1, char* str2)
{
char* s1 = str1;
char* s2 = str2;
assert(s1 && s2);
char* cur = str1; // cur遍历str1
while (*cur)
{
s1 = cur; // s1 每次是一次新的开始匹配,因为可能第一个一样,第二个第三个不一样
s2 = str2; // s2必须每次从被比较的头开始
// 相等时两个同时往后走 但不能无脑后走,因为怕s1、s2某个不存在
while (*s1&&*s2 && ( * s1 == *s2))
{
s1++;
s2++;
}
// 当s1或s2不存在,或*s1 != *s2时 会停止 或s2走完了, *s2==\0,是希望的结果
if (*s2 =='\0')
{
return cur;
}
cur++; // cur占位为str1当前比较的起始
}
return NULL; // CUR找到了\0,循环退出了,应该返回NULL 意思是找不到
}
int main()
{
char arr1[] = "abbcdef";
char arr2[] = "cdef";
char* ret = my_strstr(arr1, arr2);
if (NULL == ret)
printf("找不到子串\n");
else {
printf("找到了\n");
printf("%s\n", ret);
}
return 0;
}
KMP算法:查找子串