进制互转
转其他进制:
hex(<数字>)
oct(<数字>)
bin(<数字>)
转10进制:
int(’<数字>’,<整数,表示前面一个参数进制数>)
如:
int('10',2)
int('10',8)
int('10',16)
int('0o21',8)
hex(16)
oct(16)
bin(16)
获取字符编码序号
ord(“<字符>”)
chr(<数字>)
ord('一')
Out[148]: 19968
ord("\u4e00")
Out[157]: 19968
chr(19968)
Out[150]: '一'
unicode汉字集
\u4e00 - \u9FFF的是中日韩汉字字符区间。其中
\u4e00 -\u9fd5 是所有汉字,剩下的没有字符。
"\u4e00"
Out[151]: '一'
"\u9fd5"
Out[152]: '鿕'
汉字标点
[
8211, 8212, 8216, 8217, 8220, 8221,
8230, 12289, 12290, 12296, 12297, 12298,
12299, 12300, 12301, 12302, 12303, 12304,
12305, 12308, 12309, 65281, 65288, 65289,
65292, 65294, 65306, 65307, 65311
]
英文和数字
48-57 表示0-9
65-90 表示A-Z
97-122 表示a-z
符号unicode对应分段
如英文标点
for i in range(ord('\uff01'),ord("\uff0f")+1):
print(chr(i))