C语言之字符串类型以及字符串和字符数组的细节

一 :C语言的字符串类型

        1 :C语言没有原生字符串类型

                (1)很多高级语言,像java、c#等就有字符串类型,有个string来表示字符串,用法和int这些很像,可以string s1= "linux"; 来定义字符串类型的变量

                (2)C语言没有string类型,C语言中的字符串是通过字符指针来间接实现的

        2 :C语言使用指针来管理字符串

                (1)C语言定义字符串方法:char *p = "linxu"; 此时p就叫做字符串,但是实际上p只是一个字符指针(本质上就是一个指针变量,只是p指向了一个字符串的起始地址而已)

        3 :C语言中字符串的本质 :指针指向头、固定尾部的地址相连的一段内存

                (1) 字符串就是一串字符。字符反应在现实中就是文字、符号、数字等人用来表示的字符,反映在编程中就是字符类型的变量。C语言中使用ASCCII编码对字符进行编程,编码后可以用char型变量来表示一个字符。字符串就是多个字符打包在一起共同组成的。

                (2)字符串在内存中其实就是多个字节连续分布构成的(类似于数组,字符串和字符数组非常像)

                (3)C语言字符串有三个核心要点:第一是用一个指针指向字符串头;第二是固定尾部(字符串总是以'\0'来结尾);第三是组成字符串的各字符彼此地址相连

                (4)'\0'是一个ASCII字符,其实就是编码为0的那个字符(真正的0,和数字0是不同的,数字0有它自己的ASCII编码)。要主要区分'\0'和'0'和.0(0等于'\0','0'等于48)

                (5)'\0'作为一个特殊的数字被字符串定义为(幸运的被选为)结尾标志。产生的副作用就是:字符串中无法包含'\0'这个字符。(C语言中不可能存在一个包含'\0'字符的字符串),这种思路就叫做"魔数"(魔数就是选出来的一个特殊的数字,这个数字表示一个特殊的含义,你的正式内容中不能包含这个魔数作为内容)

        4 :注意 :指向字符串指针和字符串本身是分开的东西

                (1)char *p = "linux"; 在这段代码中,p本质上是一个字符指针,占4字节;"linux"分配在代码段,占6个字节;实际上总共耗费了10个字节(64位linux的话是14个字节),这10个字节中:4字节的指针p(64位linux系统中是8个字节)叫做字符串指针(用来指向字符串的,理解为字符串的引子,但是它本身不是字符串),5字节的用来存linux这5个字符的内存才是真正的字符串,最后一个用来存'\0'的内存是字符串结尾标志(本质上也不属于字符串)

        5 : 存储多个字符的两种方式 :字符串和字符数组

                (1)我们有多个连续字符(典型就是linux这个字符串)需要存储,实际上有两种方式:第一种就是字符串;第二种就是字符数组。

#include <stdio.h>

int main(void)
{
    

    char *p = "linux";        //字符串

    char str[] = "linux";     //字符数组


       printf("p = %s\n",p);
       printf("str = %s\n",str);
   
        


    return 0;


}

         二  : 字符串和字符数组的细节

                        1:  字符数组初始化与sizeof、strlen

                         (1)sizeof是C语言的一个关键字,也是C语言的一个运算符(sizeof使用时是sizeof(类型或变量名),所以很多人误以为sizeof是函数,其实不是),sizeof用来返回一个类型或者变量所占用的内存字节数。为什么需要sizeof?主要原因:一是原生类型int、double等原生类型占几个字节和平台有关;二是C语言除了ADT之外还有UDT,这些用户自定义类型无法一眼看出来,所以用sizeof运算符来进行计算

                          (2)strlen是C语言的一个库函数,这个函数的原型是:size_t strlen(const char *s);这个函数接收一个字符串的指针,返回字符串的长度(以字节为单位)。注意一点:这个长度是不包括结尾的'\0'的。我们为什么需要strlen函数?因为从字符串的定义(指针指向头、固定结尾、中间依次相连)可以看出无法直接的到字符串的长度,需要用strlen函数来计算字符串的长度

//用strlen函数计算字符串的长度
#include <stdio.h>
#include <string.h>        //strlen所在的库函数

int main(void)
{


    char *p = "linux";

    int len = strlen(p);        //这里计算的字符串长度是不算上结尾的'\0'的

    printf("len = %d\n",p);

    return 0;

}
//也可以自建函数来实现strlen函数的功能
#include <stdio.h>

int mystrlen(const char *s)   //指针指向字符常量     
{

    int a = 0;                

    while(*s++ != '\0')       //当*s == '\0'(字符串结尾时),退出while循环
        {
            
            a++;
            
        }

    return a;                //退出while时返回循环次数,就计算出字符开始到结束有几个字节


}

int mian(void)
{
    int len = 0;            //定义一个整型变量用来接收返回值

    char *p = "linux"l      //定义一个字符串
    
    len = mystrlen(p);      //调用自建函数完成对指针函数指向的字符串"linux"字符串大小的计算
        
    printf("len = %d\n",len);  //打印结果,结果与C语言函数库中strlen函数函数结果相同    

    return 0;

}

                        (3) sizeof(数组名) ,得到的永远是数组的元素的个数(也就是数组的大小),和数组中有无初始话、初始化多、少是没有关系的;strlen是用来计算字符串的长度的,只能传递合法的字符串才有意义,如果随便传递一个字符指针,这个字符指针并不是字符串是没有意义的

                        (4)当我们定义数组时,如果没有给出明确大小,则必须同时给出初始化式,编译器会去根据初始化式自动计算数组的大小(数组定义时必须直接给出大小或初始化式)

 

                        2 : 字符串初始化与sizeof、strlen

                               (1)char *p = "linux"; sizeof(p) 得到的值永远是4(在32位机,64位linux是8个字节),因为sizeof这时候测得是指针p本身的长度,和字符串的长度是无关的

#include <stdio.h>


int main(void)
{

    
    char *p = "linux";
    
    printf(" sizeof(p) = %d\n",sizeof(p));        //打印出指针p所占字节长度

    
    return 0;

}

                                (2)strlen刚好用来计算字符串的长度

                                

#include <stdio.h>
#include <string.h>        //包含strlen的函数库



int main(void)
{

    char *p = "linux";

    printf("strlen(p) = %d\n",strlen(p));            //打印指针p指向的地址的字符串长度

    return 0;

}
                        3 : 字符数组与字符串的本质差异(从内存分配角度)

                                (1)字符数组char a[] = "linux";  定义了一个数组a ,数组占六个字节,右值"linux"本身只存在于编译器中,编译器将它用来初始化字符数组a后丢弃掉(也就是说内存中是没有这个字符串"linux"的);这句就相当于char a[] = { 'l', 'i','n','u','x','\0'};

                                (2)字符串 char *p = "linux"; 定义了一个字符指针p,p占4个字节,分配在栈上;同时还定义了一个字符串"linux",分配在代码段;然后把代码段中的字符串(6个字节)的首地址(也就是'l'的地址)赋值给p

总结对比:字符数组和字符串有本质差别。字符数组本身是数组,数组自身自带内存空间,可以用来存东西(所以数组类似于容器);而字符串本身是指针,本身永远只占4字节,而且这4个字节还不能用来存有效数据,只能把有效数据存到别的地方,然后把地址存在p中。

也就是说字符数组自己存那些字符;字符串一定需要额外的内存来存那些字符,字符串本身只存真正那些字符的所在内存空间的首地址

#include <stdio.h>

char b[7];

int main(void)
{


    //字符串存在栈上
    char a[7];
    char *p = a;


    //字符串存在数据段
    char *p1 = b;

    //字符串存在堆空间
    char *p2 = (char *)malloc(7);


    return 0;

}
                 
  • 27
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值