python特殊字符编码_python 特殊字符导致的编码问题

最近遇到一个弄不太懂的问题, 是关于用 Python 遍历文件夹的文件并把文件名存储起来,对于一些有特殊字符的文件名出现了一些比较奇怪的问题

#!/usr/bin/env python

# -*- coding: utf-8 -*-

import json

import sys

reload(sys)

sys.setdefaultencoding('utf8')

p(sys.getdefaultencoding)

s = '中文ì'

print s#输出"中文ì"

print json.dumps({'name':'ìì'})#奇葩的输出:{"name": "i\u0300\u00ec"}

print json.dumps({'name2':'Elpìs--Aletheia\'s lullaby.mp3'})#特殊字符是从上名的输出 s 语句中的结果中copy过来的,输出是正确的

print json.dumps({'name4':'Elpìs - Lost in Thoughts'})#直接从文件名中拷贝来的,特殊字符输出是错误的编码

对于特殊字符 'ì' 的编码感到迷惑,正确的输出应该为'\u00ec',   '中文ì'中的特殊字符是文件名中copy过来的,这种格式的时输出 'i\u0300' 这么奇怪的编码出来,如何才能在获取文件名的时候就处理或者避免这种情况的发生?

运行环境:

Python 2.7.6 (default, Sep 9 2014, 15:04:36) [GCC 4.2.1 Compatible Apple LLVM 6.0 (clang-600.0.39)] on darwin Type "help", "copyright", "credits" or "license" for more information.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值