29.C语言字符串和字符数组


29.1.C语言没有原生字符串类型
(1)很多高级语言像java、C#等就有字符串类型,有个String来表示字符串,用法和int这些很像,可以String s1 = “linux”;来定义字符串类型的变量。
(2)C语言没有String类型,C语言中的字符串是通过字符指针来间接实现的,譬如char *p = “linux”;此时p称为字符串,但p本质上是字符指针变量,其指向了某个字符串的起始地址。


29.2.C语言中字符串的本质
(1)字符串就是一串字符,字符反映在现实中是文字、符号、数字等人用来表达的字符,反映在编程中就是字符类型的变量。C语言使用ASCII码对字符进行编码,编码后可使用char型变量来表示某个字符。字符串就是多个字符打包在一起共同组成的。
(2)字符串在内存中其实就是多个字节连续分布组成的(类似数组,字符数组和字符串非常像)。字符串即指针指向字符串头并且固定尾部(字符串总是以’\0’来结尾)的地址相连(组成字符串的各字符彼此地址相连)的一段内存。
(3)’\0’是一个ASCII字符,是ASCII编码值为0的那个字符(’\0’的ASCII编码值为0;’0’的ASCII编码值为48)。’\0’作为一个特殊的数字被字符串定义为(幸运的选为)结尾标志。产生的副作用就是:字符串中无法包含’\0’这个字符。(C语言中不可能存在一个包含’\0’字符的字符串),这种思路就叫“魔数”(魔数就是选出来的一个特殊的数字,这个数字表示一个特殊的含义,你的正式内容中不能包含这个魔数作为内容,譬如C语言中的关键字)。


29.3.字符串指针和字符串本身
(1)char *p = “linux”;p本质上是一个字符指针,占4字节;”linux”分配在代码段,占6个字节;实际上总共耗费了10个字节,这10个字节中:4字节的指针p叫做字符串指针(用来指向字符串的,理解为字符串的引子,但它本身不是字符串);5字节的用来存linux这5个字符的内存才是真正的字符串;最后一个用来存’\0’的内存是字符串结尾标志(本质上也不属于字符串)。
(2)存储多个字符的2种方式:字符串(char *p = “linux”;)和字符数组(char a[] = “linux”;)。


29.4.字符数组及字符串初始化与sizeof及strlen
(1)sizeof是C语言的一个关键字,也是C语言的一个运算符(sizeof使用格式:sizeof(类型或变量名)),sizeof运算符用来返回某个类型或者是变量所占用的内存字节数。为什么需要sizeof?第1是int、double等原生类型占几个字节和平台有关;第2是C语言中除了ADT之外还有UDT,这些用户自定义类型需要用sizeof运算符来让编译器帮忙计算占用内存空间大小。
(2)strlen是一个C语言库函数(size_t strlen(const char *s);)该函数接收某个字符串的指针,返回这个字符串的长度(以字节为单位)。注意:strlen返回的字符串长度是不包含字符串结尾的’\0’的。为什么需要strlen库函数?因为从字符串的定义(指针指向头、固定结尾、中间依次相连)可以看出无法直接得到字符串的长度,需要用strlen函数来计算得到字符串的长度。
(3)sizeof(数组名)得到的永远是数组的大小,和数组中有无初始化,初始化多、少等是没有关系的;strlen是用来计算字符串的长度的,只能传递合法的字符串进去才有意义,若传递的字符指针并不是字符串则是没有意义的。
(4)当我们定义数组时如果没有明确给出数组大小,则必须同时给出初始化式,编译器会根据初始化式去自动计算数组的大小(数组定义时必须给出大小,要么直接给,要么给初始化式)。
(5))char *p = “linux”; sizeof(p)得到的永远是4,因为这时候sizeof测的是字符指针p本身的长度,和字符串的长度是无关的;strlen刚好用来计算字符串的长度。


29.5.字符数组与字符串的本质差异
(1)字符数组char a[] = “linux”;来说,定义了一个数组a,数组a占6字节,右值”linux”本身只存在于编译器中,编译器将它用来初始化字符数组a后丢弃掉(内存中是没有”linux”这个字符串的);该语句等价于char a[] = {‘l’, ‘i’, ‘n’, ‘u’, ‘x’, ‘\0’}。;
(2)字符串char *p = “linux”;定义了一个字符指针p,p占4字节,分配在栈上;同时还定义了一个字符串”linux”,分配在代码段;然后把代码段中的字符串(一共占6字节)的首地址(也就是’l’的地址)赋值给p。
(3)总结:字符数组和字符串有本质差别。字符数组本身是数组,数组自身自带内存空间,可以用来存东西(所以数组类似于容器);而字符串本身是指针,本身永远只占4字节,而且这4个字节还不能用来存有效数据,所以只能把有效数据存到别的地方,然后把地址存在p中。即字符数组自己存那些字符;字符串则需要额外的内存来存那些字符,字符串本身只存真正的那些字符所在的内存空间的首地址。


29.array_string
/*
 * 公司:XXXX
 * 作者:Rston
 * 博客:http://blog.csdn.net/rston
 * GitHub:https://github.com/rston
 * 项目:C语言字符串和字符数组
 * 功能:演示字符串和字符数组的与strlen和sizeof的纠葛。
 */
#include <stdio.h>
#include <string.h>
#include <stdlib.h>

int mystrlen(const char *str)       
{
    int cnt = 0;
    while (*str++ != '\0')
    {
        cnt++;
    }
    return cnt;
}

char b[] = "hello";

int main(int argc, char **argv)
{
    // strlen库函数的作用是返回字符串的长度
    char *str = "linux";
    int mylen = mystrlen(str);
    int len = strlen(str);
    printf("len = %d. mylen = %d.\n", len, mylen);      // len = 5. mylen = 5.

    // 数组和sizeof关键字的使用
    int a[4] = {0};
    printf("sizeof(a) = %d.\n", sizeof(a));             // sizeof(a) = 16.

    // 字符串初始化和strlen及sizeof关键字的使用
    char *s = "linux";
    printf("sizeof(s) = %d\n", sizeof(s));              // sizeof(s) = 4
    printf("strlen(s) = %d\n", strlen(s));              // strlen(s) = 5

    // 字符串存放在数据段
    char *c = b;

    // 字符串存放在栈中
    char d[] = "hello";
    char *e = d;

    // 字符串存放在堆中
    char *f = (char *)malloc(10*sizeof(char));

    return 0;
}

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值