每日10行代码110: Python中获取含中文字符串的“真实”长度

天天卡丁

于 2021-01-26 22:23:00 发布

阅读量581

点赞数

分类专栏：每日10行代码 Python 文章标签： python

本文链接：https://blog.csdn.net/weixin_44981444/article/details/113198149

版权

每日10行代码同时被 2 个专栏收录

178 篇文章 18 订阅

订阅专栏

Python

176 篇文章 4 订阅

订阅专栏

因为在好多地方，一个中文算两个字符，所以写了一函数，来计算所需要的最大长度。

import sys
def db_len(column):
    if sys.getsizeof(column) - len(column)>25:
        return 2*len(column) # 只要含中文，长度就乘2，因为如果有含中文，那么这个字符串后期就有可能修改为全中文
    else:
        return len(column)

s1 = "中国123"
print(db_len(s1))
>>>
10

如果想知道精确的长度，代码也可以这样实现：

def get_real_len(string):
    real_len = len(string)
    for ch in string:
        if '\u2E80' <= ch <= '\uFE4F':
            real_len += 1
    return real_len

s1 = "《》"  
print(get_real_len(s1))
>>>
7

好多地方写的判断中文用的是’\u4e00’ <= _char <= ‘\u9fa5’ ，但是我发现这样会漏掉一些中文符号，所以更加准确的范围应该是：

'\u2E80' <= ch <= '\uFE4F'

天天卡丁

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
每日10行代码110: Python中获取含中文字符串的“真实”长度

因为在好多地方，一个中文算两个字符，所以写了一函数，来计算所需要的最大长度。import sysdef db_len(column): if sys.getsizeof(column) - len(column)>25: return 2*len(column) # 只要含中文，长度就乘2，因为如果有含中文，那么这个字符串后期就有可能修改为全中文 else: return len(column)s1 = "中国123"print(db_len(
复制链接

扫一扫

专栏目录