有的时候需要判断某个字符是不是中文(英文,日文……),但是不可能吧所有字符都列出来,看字符是不是在里面。这个时候可以根据unicode编码的范围来判断是哪个语言,比如,中文的范围是4e00~9fa5。其他字符的范围可以从这里面找一下:https://unicode-table.com/cn/blocks/basic-latin/
如果是判断字符是否为中文:
def check(c):
return '\u4e00' <= c <= '\u9fa5'
还有个需求,可能是要打印某个语言所有字符,其实unocde编码与int值是一一对应的,所以这时候用chr()函数把对应的值转化一下就可以了:
s = ''
for i in range(0x4e00, 0x9fa5):
s += chr(i)
print(s)