我对我写的这段代码所涉及的类型有问题。理想情况下,我不会花任何心思去编码类型,但有时你是被迫的。在
所以这一切都围绕着Windows上NTFS的目录遍历。文件名中的某些字符(似乎是unicode)无法写入文件或打印到标准的windows终端(是的,我尝试了“chcp 65001”打印,但这不起作用,但我还是需要写入标准的纯文本文件)
所以我做下面的工作。据我所知,Python3(我使用的是3.2.2)是unicode,所以str()对象(以及所有支持lib)都是unicode,所以我这样做了:absfilepath = os.path.join(root, file).encode()
我认为utf-8字符串会被返回,这一切都很好,但是当我开始写文件或stdout时,我发现了关于str()的隐式类型转换的错误。所以我做了以下几点:
^{pr2}$
(hashmap稍后被转储)。在
现在认为它是在本机unicode Python3字符串中…但是当我将它转储到文件中时,使用以下命令:for key, val in m.items():
f.write(key + "|" + val + "\n")
我还在档案里找到这个:e77bceb64d179377731a94186e56281c|b'K:\Filename'
它表示为字节数组。在
那我做错什么了?很抱歉,这个目录树中有“非传统”字符,我希望它们不在那里,但它们在那里。如何存储它们(转换它们?)以一种可以用普通纯文本(ASCII?)打印/写入的方式为什么从我的hashmap返回一个字节数组,我清楚地存储了一个标准字符串?处理unicode对我来说是一段相当可怕的经历。在