linux shell 变量长度,变量 - bash中的字符串长度

UTF-8字符串长度

除了fedorqui的正确答案,我想展示字符串长度和字节长度之间的区别:

myvar='Généralités'

chrlen=${#myvar}

oLang=$LANG oLcAll=$LC_ALL

LANG=C LC_ALL=C

bytlen=${#myvar}

LANG=$oLang LC_ALL=$oLcAll

printf "%s is %d char len, but %d bytes len.\n" "${myvar}" $chrlen $bytlen

将呈现:

Généralités is 11 char len, but 14 bytes len.

你甚至可以查看存储的字符:

myvar='Généralités'

chrlen=${#myvar}

oLang=$LANG oLcAll=$LC_ALL

LANG=C LC_ALL=C

bytlen=${#myvar}

printf -v myreal "%q" "$myvar"

LANG=$oLang LC_ALL=$oLcAll

printf "%s has %d chars, %d bytes: (%s).\n" "${myvar}" $chrlen $bytlen "$myreal"

会回答:

Généralités has 11 chars, 14 bytes: ($'G\303\251n\303\251ralit\303\251s').

Nota:根据Isabell Cowan的评论,我已将设置添加到$LC_ALL以及printf。

论证的长度

参数与常规变量相同

strLen() {

local bytlen sreal oLang=$LANG oLcAll=$LC_ALL

LANG=C LC_ALL=C

bytlen=${#1}

printf -v sreal %q "$1"

LANG=$oLang LC_ALL=$oLcAll

printf "String '%s' is %d bytes, but %d chars len: %s.\n" "$1" $bytlen ${#1} "$sreal"

}

将作为

strLen théorème

String 'théorème' is 10 bytes, but 8 chars len: $'th\303\251or\303\250me'

有用的printf修正工具:

如果你:

for string in Généralités Language Théorème Février "Left: ←" "Yin Yang ☯";do

printf " - %-14s is %2d char length\n" "'$string'" ${#string}

done

- 'Généralités' is 11 char length

- 'Language' is 8 char length

- 'Théorème' is 8 char length

- 'Février' is 7 char length

- 'Left: ←' is 7 char length

- 'Yin Yang ☯' is 10 char length

不是很漂亮......为此,有一点功能:

strU8DiffLen () {

local bytlen oLang=$LANG oLcAll=$LC_ALL

LANG=C LC_ALL=C

bytlen=${#1}

LANG=$oLang LC_ALL=$oLcAll

return $(( bytlen - ${#1} ))

}

那么现在:

for string in Généralités Language Théorème Février "Left: ←" "Yin Yang ☯";do

strU8DiffLen "$string"

printf " - %-$((14+$?))s is %2d chars length, but use %2d bytes\n" \

"'$string'" ${#string} $((${#string}+$?))

done

- 'Généralités' is 11 chars length, but use 14 bytes

- 'Language' is 8 chars length, but use 8 bytes

- 'Théorème' is 8 chars length, but use 10 bytes

- 'Février' is 7 chars length, but use 8 bytes

- 'Left: ←' is 7 chars length, but use 9 bytes

- 'Yin Yang ☯' is 10 chars length, but use 12 bytes

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值