C语言字符串string.h详解

本文已整合到C语言标准库深度解读

为了看上去规整简洁,令

#define cSTR const char *str
#define vSTR const void *str

由于字符串自身存在终止符\0,所以下面所有提及对字符串前n个字符的操作,均默认n小于字符串长度;若n大于字符串长度,则对字符串整体进行操作。

首先,由于C语言中的字符串无非是终止于\0的字符数组,数组中并未给我们提供任何长度信息,所以要有一个函数来计算字符串长度,此即

size_t strlen(cSTR)

然后认识一下用于分割字符串的strtok

char *strtok(char *str, const char *delim)

其功能为通过delimstr分解为一组小字符串,所谓分解,其实就是将分割符号替换为\0;然后返回被分割之后的第一个字符串。

如果strtok已经对某个字符串进行分割了,那么接下来需要将其表达式写为strtok(NULL, delim),这样可以逐一调出被分割的字符串。

//teststrtok.c
#include<stdio.h>
#include<string.h>

int main(){
	char oldStr[50] = "I am micro tiny cold";
	const char s[2] = " ";
	printf("str length: %d\n", strlen(oldStr));
	char* newStr = strtok(oldStr,s);
	while(newStr != NULL){
		printf("the oldStr is %s.\t", oldStr);
		printf("the newStr is %s with length : %d\n", newStr, strlen(newStr));
		newStr = strtok(NULL, s);
	}
	return 0;
}

测试结果为

>gcc testStrtok.c
>a.exe
str length: 20
the oldStr is I.        the newStr is I with length : 1
the oldStr is I.        the newStr is am with length : 2
the oldStr is I.        the newStr is micro with length : 5
the oldStr is I.        the newStr is tiny with length : 4
the oldStr is I.        the newStr is cold with length : 4     

接下来将string.h中的函数分为四个类别,分别是查询比较复制和追加以及本地函数

查询函数

查询函数返回类型
void *memchr(vSTR, int c, size_t n)strn个字节中首次出现c的位置指针
char *strchr(cSTR, int c)str首次出现c的位置指针
char *strrchr(cSTR, int c)str最后出现c的位置指针
char *strstr(cSTR1, cSTR2)str1中首次次出现字符串str2的位置指针
char *strpbrk(cSTR1, cSTR2)str1中首个个属于str2的字符的位置指针
size_t strspn(cSTR1, cSTR2)str1中第一个不属于str2的字符的索引整数
char *strerror(int errnum)根据错误号errnum索引错误名
详见errno.h

比较函数

比较函数返回
int memcmp(vSTR1, vSTR2, size_t n)比较str1str2的前n个字节
int strncmp(cSTR1, cSTR2, size_t n)比较str1str2的前n个字符
int strcmp(cSTR1, cSTR2)比较str1str2
size_t strcspn(cSTR1, cSTR2)str1开头连续不含str2中字符的个数

注意

有关字符串str1str2的比较中:

  • 若二者相等,则返回0
  • 若str1<str2,则返回值小于0
  • 若str1>str2,则返回值大于0

复制和追加

下面用于字符串复制的函数,均返回一个指向目标字符串的指针。

复制
char *strcpy(char *dest, vSTR)str复制到dest
char *strncpy(char *dest, cSTR, size_t n)strn个字符复制到 dest
void *memset(void *str, int c, size_t n)str的前n个字符设为c
void *memcpy(void *dest, vSTR, size_t n)
void *memmove(void *dest, vSTR, size_t n)
str的前n个字节复制到dest

其中,strncpy是对字符串的操作,而memcpy是对内存块的操作。

如果内存块发生重叠,memmove可以保证源字符串被覆盖之前,将重叠区域的字节复制到目标区域,所以比memcpy更加安全。

所谓追加,无非是将一个字符串的内容复制到另一个字符串的结尾,本质上也可称为广义的复制。

追加
char *strcat(char *dest, cSTR)str追加到dest结尾。
char *strncat(char *dest, cSTR, size_t n)str的前n个字符追加到dest结尾

本地函数

这里所谓的本地函数,就是受到locale.hLC_COLLATE影响的函数,其功能和返回值取决于当前所在的地区。string.h中共有两个本地函数,分别是用于字符串比较的strcoll和用于更改字符串格式的strxfrm

对于前者,若我们想对一组汉字按照拼音进行排序,那么就要用到strcoll,其声明为

int strcoll(cSTR1, cSTR2)

做一个测试

//testStrcoll.c
#include <stdio.h>
#include <string.h>
#include <locale.h>

void printStrcoll(const char *str1, const char *str2){
    if(strcoll(str1,str2)>0)
        printf("%s>%s\n",str1, str2);
    else
        printf("%s<%s\n",str1, str2);
}

int main (void)
{
    printf ("默认比较:");
    printStrcoll("甲","乙");

    setlocale (LC_ALL, "");
    printf ("拼音比较:");
    printStrcoll("甲","乙");

    return 0;
}

编译运行结果,由于我实在不熟悉汉字编码顺序,所以其内码比较和拼音比较的结果是一样的。另外,本程序用的是gcc11.2进行编译的,低于10的版本可能会出现汉字乱码的情况。

>gcc testStrcoll.c
>a.exe
默认比较:甲>乙
拼音比较:甲>

另一个本地函数声明为

size_t strxfrm(char *dest, cSTR, size_t n)

其功能就是简单的将str的前n个字符转换为本地形式后复制到dest中,返回值是被转换的字符长度。

关于setlocale 函数,详情请阅通过locale.h设置美元的格式

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

微小冷

请我喝杯咖啡

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值