目录
获取中文字符对应的编码
# 方式一
print('【'.encode('unicode_escape'))
# 方式二
print(hex(ord('【')))
获取编码对应的中文字符
# 方式一
print(u'\u3001\u3002')
# 方式二
start = int('3001', 16) # 起始Unicode编码
end = int('3010', 16) # 结束Unicode编码
for code in range(start, end + 1):
char = chr(code) # 将Unicode编码转换为字符
print(char)
中文字符查找
# 方式一
def get_Chinese(m_str):
m_chinese_list = re.findall('[\u201c-\u201d\u3001-\u3011\uff08-\uff1f\u4e00-\u9fa5]', m_str)
return m_chinese_list
# 方式二
def get_Chinese(m_str):
m_chinese_list = re.findall('[、。;,:“”()?《》【】\u4e00-\u9fa5]', m_str)
return m_chinese_list
GPT可真是个好东西!