计算机比较字母大小,如何比较串的大小

两个数字,很容易比较大小。2比1大,这完全正确,可是两个字符串如何比较呢?

比如"silty”、“stupid”这样的同样表达“愚蠢的”的单词字符串,它们在计算机中的大小其实取决于它们挨个字母的前后顺序。它们的第一个字母都是 s,我们认为不存在大小差异,而第二个字母,由于“i”字母比“t”字母要靠前,所以“i” < “t”,于是我们说 “silly” < “stupid”。

事实上,串的比较是通过组成串的字符之间的编码来进行的,而字符的编码指的是字符在对应字符集中的序号。

关于编码

计算机中的常用字符是使用标准的ASCII编码,更准确一点,由7位二进制数表示一个字符,总共可以表示128个字符。

后来随着一些特殊符号的出现,128个不够用,于是扩展ASCII码由8位二进制数表示一个字符,总共可以表示256个字符,这已经足够满足以英语为主的语言和特殊符号进行输入、存储、输出等操作的字符需要了。

可是,单我们国家就有除汉族外的满、回、藏、蒙古、维吾尔等多个少数民族文字,换作全世界估计要有成百上千种语言与文字,显然这256个字符是不够的,因此后来就有了 Unicode 编码,比较常用的是由16位的二进制数表示一个字符,这样总共就可以表示216个字符,约是65万多个字符,足够表示世界上所有语言的所有字符了。当然,为了和ASCII码兼容,Unicode的前256个字符与ASCII码完全相同。

所以如果我们要在C语言中比较两个串是否相等,必须是它们串的长度以及它们各个对应位置的字符都相等时,才算是相等。

串的比较

即给定两个串:s="a1a2……an",t="b1b2……bm",当且仅当 n=m,且 a1=b1, a2=b2, ……, an=bm 时,我们认为 s=t。

那么对于两个串不相等时,如何判定它们的大小呢?

给定两个串:s="a1a2……an",t="b1b2……bm"。当满足以下条件之一时,s < t。

1. n < m, 且 ai=bi( i = 1, 2, ……, n)。

比如 s = "hap", t = "happy", 就有 s < t,因为 t 比 s 多两个字符。

2. 存在某个k < min(m, n),使得ai=bi (i=l, 2, ……, k—1), ak < bk。

例如当s= “happen”,t= “happy”,因为两串的前4个字母均相同,而两串第5个字母(k值),字母e的ASCII码是101,而字母y的ASCH码是121,显然e < y,

有同学如果对这样的数学定义很不爽的话,那我再说一个字符串比较的应用。我们的英语词典,通常都是上万个单词的有序排列。就大小而言,前面的单词比 后面的要小。你在査找单词的过程,其实就是在比较字符串大小的过程。

嗯?有同学说,从不査纸质词典,都是用电子词典。电子词典査找单词实现的原理,其实就是字符串这种数据结构的典型应用,随着我们之后的讲解,大家就会明白。

延伸阅读

此文章所在专题列表如下:

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值