python中ljust填充包含中英文字符串问题

ljust是python中用于将字符串填充至指定长度的内置函数,通常用于输出中字符串的对齐。
 
但ljust在填充包含中英文字符串的时候,填充后的长度总是不对,导致输出无法真正对齐,其根本原因在于ljust中可能使用了len统计字符个数,而英文一般只占位1个字符,中文是要占位2个字符的,但len是不分中英文的,统一当成1个字符位统计。
 
>>> len('我是中文')
4
>>> len('abcd')
4
>>> str1 = '0123456789'
>>> str2 = '我是中文'
>>> len(str1)
10
>>> len(str2)
4
>>> str2.ljust(10); str1
'我是中文      '
'0123456789'
 
如上例所示,这就导致了字符串无法对齐的问题,解决的办法也随之清晰:将中文字符串计算为两个即可:
 
#为了修复ljust的一个中英文混合使用出现的bug:
#统计其中的中文个数, ljust将中英文字符通通算作一个字符,
#而每个中文字符其实相当于2个英文字数,因此相当于少算了每个中文字符1个字数
import re
def len_zh(data):
    temp = re.findall('[^a-zA-Z0-9.]+', data)
    count = 0
    for i in temp:
        count += len(i)
    return(count)
 
#调用ljust前先计算中文字符个数
zh = len_zh(str)
#动态修正填充字符数
str.ljust(20-zh)

 

此方法只是暂时解决,并不是完美的解决方案:

  • 计算中文字符是通过非运算得到的,结果并不一定可以保证准确。应该采用更好的方法统计中文字符数(相关资料
  • 覆盖重写ljust函数应该更好。
查资料之后,发现len统计字符的问题可能是和python3的utf-8编码方式有关(相关链接),utf-8编码中英文都占1字符位,gbk编码中文2字符位,英文1字符位。

转载于:https://www.cnblogs.com/tonykong/archive/2012/07/02/2572971.html

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值