前情提示: 测试代码中,右尖括号(>
)表示命令行中输入的命令; 单独一行并以井字符(#
)开头的为输出结构; 库的导入仅在本文的第一个测试代码中展现,其他代码块均省略库的导入代码。
- 系统类型:
Windows 10
- python 版本:
Python 3.9.0
此模块提供了对 Unicode Character Database
(UCD
) 的访问。UCD
中定义了所有 unicode
字符的字符属性。
unicodedata.lookup(name)
通过 unicode
字符的名称来查找 unicode
字符。
参数:
name: unicode 字符的名称
返回值:
str,unicode 字符
根据传入的名称,来查找对应的 unicode
字符,如果查找到则返回 unicode
字符,否则会引发 KeyError
错误。
import unicodedata
print(unicodedata.lookup('Cjk Compatibility Ideograph-2f80f'))
# 兔
print(unicodedata.lookup('Armenian Small Ligature Men Now'))
# ﬓ
print(unicodedata.lookup('111'))
# Traceback (most recent call last):
# File "e:\project\test\test.py", line 3, in <module>
# print(unicodedata.lookup('111'))
# KeyError: "undefined character name '111'"
unicodedata.name(chr[, default])
获取 unicode
字符的名称。
参数:
chr: str,字符
default: str,可选参数,当没有查找到 unicode 字符的名称时的默认返回值
返回值:
str,unicode 字符的名称或传入的默认值
根据传入的 unicode
字符,来查找对应的名称,如果查找到则返回名称,如果未查找到并且传入了默认值则返回默认值,如果未查找到并且没有传入默认值则会引发 ValueError
错误。
print(unicodedata.name('a'))
# LATIN SMALL LETTER A
print(unicodedata.name('❋'))
# HEAVY EIGHT TEARDROP-SPOKED PROPELLER ASTERISK
print(unicodedata.name('✍'))
# WRITING HAND
PS: 不是小编不测试默认值和报错,是根本找不到不是 unicode
字符的字符。😂
'毫无用处’三兄弟?
unicodedata.decimal(chr[, default])
unicodedata.digit(chr[, default])
unicodedata.numeric(chr[, default])
得到表示数字字符的数值
参数:
chr: str,数字字符
default: str,可选参数,当没有查找到 unicode 字符的名称时的默认返回值
返回值:
int,表示数字字符的数值
传入一个数字字符,然后返回一个表示数字字符的数值,如果传入参数不符合要求,那么将引发 ValueError
错误,当 default
参数有值时则返回 default
参数的值。
print(unicodedata.decimal('3'))
# 3
print(unicodedata.decimal('b', 'Error'))
# Error
print(unicodedata.decimal('b'))
# Traceback (most recent call last):
# File "e:\project\test\test.py", line 3, in <module>
# print(unicodedata.decimal('b'))
# ValueError: not a decimal
经过一番测试,小编发现仅仅能传入 '0'
~'9'
这 10
个 str
类型的数字,其他的均会报错。也就是说,传入一个 str
类型的数字&#