python输出utf-8编码的字符_在python 2.7中打印UTF-8字符

在Python 2.7中,遇到读取UTF-8编码文件并尝试打印单个字符时出现乱码的问题。讨论了如何正确处理UTF-8编码的字符,包括使用`decode('utf8')`方法和理解UTF-8编码的字节宽度。还提到了Python 3中更好的Unicode处理和一些相关的资源链接。
摘要由CSDN通过智能技术生成

这是我打开,阅读和输出的方式。 该文件是用于Unicode字符的UTF-8编码文件。 我想打印前10个UTF-8字符,但是下面代码片段的输出显示了10个无法识别的怪异字符。 想知道是否有人对如何正确打印有任何想法? 谢谢。

with open(name, 'r') as content_file:

content = content_file.read()

for i in range(10):

print content[i]

10个怪异角色中的每个角色都像这样,

?

问候,

共享文本文件内容

您的控制台或tty也必须支持该字符-您可能必须更改终端设置。

@cdarke,谢谢并投票。 我的控制台可以正确print content,这应该证明它支持UTF-8字符。 仅当我打印content[i]时才会发生此问题。 如果您有任何想法,那就太好了。

@RahulKumar,谢谢并投票。 不知道如何在此处发布原始原始文件,我尝试过,我的控制台可以正确地print content,这应该证明它支持UTF-8字符。 仅当我打印content[i]时才会发生此问题。 如果您有任何想法,那就太好了。

您可能会发现这篇文章很有帮助:实用Unicode,由SO老兵Ned Batchelder编写。

将Unicode代码点(字符)编码为UTF-8时,某些代码点将转换为单个字节,但是许多代码点会超过一个字节。标准7位ASCII范围内的字符将被编码为单个字节,但是更多的外来字符通常将需要更多的字节进行编码。

因此,您将获得那些奇怪的字符,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值