将字符串打印为十六进制字节?
接受的答案给出:
s = "Hello world !!"
":".join("{:02x}".format(ord(c)) for c in s)
收益:
'48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21'
只有在使用字节(主要是ascii字符)时,接受的答案才有效。 但是如果你使用unicode,例如:
a_string = u"Привет мир!!" # "Prevyet mir, or "Hello World" in Russian.
你需要以某种方式转换为字节。
如果您的终端不接受这些字符,您可以从utf-8解码或使用名称(这样您就可以粘贴并运行代码):
a_string = (
"\N{CYRILLIC CAPITAL LETTER PE}"
"\N{CYRILLIC SMALL LETTER ER}"
"\N{CYRILLIC SMALL LETTER I}"
"\N{CYRILLIC SMALL LETTER VE}"
"\N{CYRILLIC SMALL LETTER IE}"
"\N{CYRILLIC SMALL LETTER TE}"
"\N{SPACE}"
"\N{CYRILLIC SMALL LETTER EM}"
"\N{CYRILLIC SMALL LETTER I}"
"\N{CYRILLIC SMALL LETTER ER}"
"\N{EXCLAMATION MARK}"
"\N{EXCLAMATION MARK}"
)
所以我们看到:
":".join("{:02x}".format(ord(c)) for c in a_string)
回报
'41f:440:438:432:435:442:20:43c:438:440:21:21'
一个糟糕/意想不到的结果 - 这些代码点结合在一起,形成我们在unicode中看到的字形,来自unicode联盟 - 代表全世界的语言。 这不是我们实际存储此信息的方式,因此可以由其他来源解释。
要允许其他源使用此数据,我们通常需要转换为utf-8编码,例如,将此字符串以字节为单位保存到磁盘或发布到html。 因此我们需要使用该编码将代码点转换为utf-8的代码单元 - 在Python 3中,不需要c,因为ord是整数的可迭代:
>>> ":".join("{:02x}".format(c) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
或者更优雅的是,使用新的f字符串(仅在Python 3中可用):
>>> ":".join(f'{c:02x}' for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
在Python 2中,首先将c传递给ord,即ord(c) - 更多示例:
>>> ":".join("{:02x}".format(ord(c)) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
>>> ":".join(format(ord(c), '02x') for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'