unicodedata -- Unicode 数据库

最新推荐文章于 2024-05-28 10:03:03 发布

暗语寒飞

最新推荐文章于 2024-05-28 10:03:03 发布

阅读量1.2k

点赞数

分类专栏： python标准库文章标签： python 编程语言

本文链接：https://blog.csdn.net/qq_40256959/article/details/111151082

版权

前情提示: 测试代码中，右尖括号（>）表示命令行中输入的命令；单独一行并以井字符（#）开头的为输出结构；库的导入仅在本文的第一个测试代码中展现，其他代码块均省略库的导入代码。

系统类型: Windows 10
python 版本: Python 3.9.0

此模块提供了对 Unicode Character Database (UCD) 的访问。UCD 中定义了所有 unicode 字符的字符属性。

unicodedata.lookup(name)

通过 unicode 字符的名称来查找 unicode 字符。

参数:
    name: unicode 字符的名称
返回值:
    str，unicode 字符

根据传入的名称，来查找对应的 unicode 字符，如果查找到则返回 unicode 字符，否则会引发 KeyError 错误。

import unicodedata

print(unicodedata.lookup('Cjk Compatibility Ideograph-2f80f'))
# 兔
print(unicodedata.lookup('Armenian Small Ligature Men Now'))
# ﬓ
print(unicodedata.lookup('111'))
# Traceback (most recent call last):
#   File "e:\project\test\test.py", line 3, in <module>
#     print(unicodedata.lookup('111'))
# KeyError: "undefined character name '111'"

unicodedata.name(chr[, default])

获取 unicode 字符的名称。

参数:
    chr: str，字符
    default: str，可选参数，当没有查找到 unicode 字符的名称时的默认返回值
返回值:
    str，unicode 字符的名称或传入的默认值

根据传入的 unicode 字符，来查找对应的名称，如果查找到则返回名称，如果未查找到并且传入了默认值则返回默认值，如果未查找到并且没有传入默认值则会引发 ValueError 错误。

print(unicodedata.name('a'))
# LATIN SMALL LETTER A
print(unicodedata.name('❋'))
# HEAVY EIGHT TEARDROP-SPOKED PROPELLER ASTERISK
print(unicodedata.name('✍'))
# WRITING HAND

PS: 不是小编不测试默认值和报错，是根本找不到不是 unicode 字符的字符。😂

'毫无用处’三兄弟?

unicodedata.decimal(chr[, default])
unicodedata.digit(chr[, default])
unicodedata.numeric(chr[, default])

得到表示数字字符的数值

参数:
    chr: str，数字字符
    default: str，可选参数，当没有查找到 unicode 字符的名称时的默认返回值
返回值:
    int，表示数字字符的数值

传入一个数字字符，然后返回一个表示数字字符的数值，如果传入参数不符合要求，那么将引发 ValueError 错误，当 default 参数有值时则返回 default 参数的值。

print(unicodedata.decimal('3'))
# 3
print(unicodedata.decimal('b', 'Error'))
# Error
print(unicodedata.decimal('b'))
# Traceback (most recent call last):
#   File "e:\project\test\test.py", line 3, in <module>
#     print(unicodedata.decimal('b'))
# ValueError: not a decimal

经过一番测试，小编发现仅仅能传入 '0'~'9' 这 10 个 str 类型的数字，其他的均会报错。也就是说，传入一个 str 类型的数字&#

最低0.47元/天解锁文章

暗语寒飞

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
unicodedata -- Unicode 数据库

前情提示: 测试代码中，右尖括号（>）表示命令行中输入的命令；单独一行并以井字符（#）开头的为输出结构；库的导入仅在本文的第一个测试代码中展现，其他代码块均省略库的导入代码。系统类型: Windows 10python 版本: Python 3.9.0此模块提供了对 Unicode Character Database (UCD) 的访问。UCD 中定义了所有 unicode 字符的字符属性。unicodedata.lookup(name)通过 unicode 字符的名称来查找 un
复制链接

扫一扫