python打开文件写文件乱码_Python读写文件乱码问题

对开发者来说,最恼人的问题之一莫过于读写文件的时候,由于编码千差万别,出现乱码问题。好难快速解决啊。。。

最近我也遇到了这样的问题,经研究,把大致的解决思路拿出来共享。

1. python中习惯首先声明编码类型

#!/usr/bin/python

# -*- coding: -*-

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

PS:不一定所有文件都是 utf-8 编码的,这里要注意啊。。。

2. 出现编码问题时,首先查看下该文件的初始编码方式,linux下命令为 :file -i filename

eg:当前文件的编码为 “ISO-8859-1”,随后就将Python中的”utf-8“做了相应修改

在读取文件时,需要先解码:

str = str.decode("ISO-8859-1") ## 这样返回的就是unicode的str

在写入文件时,再用同样的方式编码(这里暂且不提文件转码):

str = str.encode("ISO-8859-1")

例如,解析一段“ISO-8859-1”编码的json,代码如下

import json

Jstr = json.loads(str, encoding="ISO-8859-1")

########

## handle sth to ”data“

########

print data.encode("ISO-8859-1")

这样print 或 写入的文件就不存在乱码啦。

3:utf-8格式写入文件

如果以上 json 文件是 utf-8 编码,写入后转为了 unicode,现在要写入utf-8,可以用如下方式:

import codecs

name='xxx.json'

f=codecs.open(name,'r',encoding='utf8')

of=codecs.open(name+'.txt','w', encoding='utf8')

for line in f:

dictdata=json.loads(line)

out=json.dumps(dictdata,indent=4, ensure_ascii=False)

of.write(out+'\n')

of.close()

Python读写文件

Python读写文件1.open使用open打开文件后一定要记得调用文件对象的close()方法.比如可以用try/finally语句来确保最后能关闭文件. file_object = open('t ...

[Python]读写文件方法

http://www.cnblogs.com/lovebread/archive/2009/12/24/1631108.html [Python]读写文件方法 http://www.cnblogs.c ...

解决 python 读取文件乱码问题(UnicodeDecodeError)

解决 python 读取文件乱码问题(UnicodeDecodeError) 确定你的文件的编码,下面的代码将以'utf-8'为例,否则会忽略编码错误导致输出乱码 解决方案一 with open(r' ...

java 读写文件乱码问题

这样写,会出现乱码.原因是文件时gbk格式的, BufferedReader br = new BufferedReader(new FileReader(indir)); BufferedWrite ...

java(IO)读写文件乱码转换UTF-8问题

java(IO)读写文件乱码转换UTF-8问题 读取文件 String Content = ""; // 文件很长的话建议使用StringBuffer try { FileInpu ...

Python读写文件实际操作的五大步骤

Python读写文件在计算机语言中被广泛的应用,如果你想了解其应用的程序,以下的文章会给你详细的介绍相关内容,会你在以后的学习的过程中有所帮助,下面我们就详细介绍其应用程序. 一.打开文件 Pytho ...

python 读写文件和设置文件的字符编码

一. python打开文件代码如下: f = open("d:\test.txt", "w") 说明:第一个参数是文件名称,包括路径:第二个参数是打开的模式mo ...

【Python开发】python读写文件,和设置文件的字符编码比如utf-8

一. python打开文件代码如下: f = open("d:\test.txt", "w") 说明: 第一个参数是文件名称,包括路径: 第二个参数是打开的模式 ...

从用python自动生成.h的头文件集合和类声明集合到用python读写文件

最近在用python自动生成c++的类.因为这些类会根据需求不同产生不同的类,所以需要用python自动生成.由于会产生大量的类,而且这些类是变化的.所以如果是在某个.h中要用include来加载这些 ...

随机推荐

jstack简单使用,定位死循环、线程阻塞、死锁等问题

当我们运行java程序时,发现程序不动,但又不知道是哪里出问题时,可以使用JDK自带的jstack工具去定位: 废话不说,直接上例子吧,在window平台上的: 死循环 写个死循环的程序如下: pac ...

1029-对c语言文法的理解

→| →| →&lt ...

用VS2012或VS2013在win7下编写的程序在XP下运行就出现“不是有效的win32应用程序

经常创建项目的时候,采用空项目,那么编译成功后,最好修改下sbusystem . 链接器->系统->子系统->控制台或windows 后面的"最低版本"是5.01

小程序-组件component和模版template的选择和使用

小程序提供了组件component和模版template那什么时候 选择哪一个使用呢?我总结了一下 template主要是模版,对于重复的展示型模块进行展示,其中调用的方法或者数据data都是需要引用 ...

No.3

1.查看httpd进程数(即prefork模式下Apache能够处理的并发请求数): ps -ef | grep httpd | wc -l 返回结果示例: 1388 表示Apache能够处理1388 ...

Yosimite10.10(Mac os)安装c/c++内存检测工具valgrind

1.下载支持包m4-1.4.13.tar.gz $ curl -O http://mirrors.kernel.org/gnu/m4/m4-1.4.13.tar.gz 2. 解压m4-1.4.13.t ...

为什么CPU的主频止步于4GHz?

你对CPU的认识大概还停留在奔腾4年代吧……奔腾4最终止步于3.8GHz,原计划推出的4GHz奔腾4处理器也被胎死腹中.英特尔意识到处理器研发道路上走入了“唯主频论”的误区,2004年10月,英特尔总 ...

【xsy2194】Philosopher set+线段树合并

题目大意:给你一个长度为$n$的序列,有$m$次操作,每次操作是以下两种之一: 对某个区间内的数按照升序/降序排序,询问某个区间内数的积在十进制下首位数字是多少. 数据范围:$n,m≤2\times ...

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值