python中文件的读取和写入_Unicode（UTF-8）在Python中读取和写入文件

最新推荐文章于 2021-01-29 22:07:49 发布

weixin_39967120

最新推荐文章于 2021-01-29 22:07:49 发布

阅读量437

点赞数

文章标签： python中文件的读取和写入

Unicode(UTF-8)在Python中读取和写入文件

我在理解文本读取和写入文件时遇到了一些大脑失败(Python 2.4)。

# The string, which has an a-acute in it.

ss = u'Capit\xe1n'

ss8 = ss.encode('utf8')

repr(ss), repr(ss8)

(“u'Capit \ xe1n'”，“'Capit \ xc3 \ xa1n'”)

print ss, ss8

print >> open('f1','w'), ss8

>>> file('f1').read()

'Capit\xc3\xa1n\n'

所以我输入Capit\xc3\xa1n我最喜欢的编辑器，在文件f2中。

然后：

>>> open('f1').read()

'Capit\xc3\xa1n\n'

>>> open('f2').read()

'Capit\\xc3\\xa1n\n'

>>> open('f1').read().decode('utf8')

u'Capit\xe1n\n'

>>> open('f2').read().decode('utf8')

u'Capit\\xc3\\xa1n\n'

我在这里不理解什么？显然，我缺少一些重要的魔法(或者很有道理)。在文本文件中键入什么来获得正确的转换？

我真正没有想到的是，UTF-8表示的重点是，如果你真的不能让Python识别它，那么它来自外部。也许我应该只是JSON转储字符串，并使用它，因为它有一个asciiable表示！更重要的是，当从文件进入时，Python会识别和解码这个Unicode对象的ASCII表示吗？如果是这样，我怎么得到它？

>>> print simplejson.dumps(ss)

'"Capit\u00e1n"'

>>> print >> file('f3','w'), simplejson.dumps(ss)

>>> simplejson.load(open('f3'))

u'Capit\xe1n'

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39967120

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

idea去除不需要的提交，提交时出现很多我不需要的提交文件，项目拉取项目时不更新文件

qq_36469875的博客

11-18

3115

更新代码是忽略跟踪文件 # git update-index --assume-unchanged PATH git update-index --assume-unchanged src/main/resources/application.yml idea 中编写忽略版本控制文件在idea 中根目录中创建.gitignore 文件,常见内容：添加.idea/ exam.iml # Compiled class file *.class # Log file *.log # BlueJ file

python open w wb_Python关于文件读写的总结

weixin_39942488的博客

11-21

3359

# 文件的操作 # 打开文件 open # 默认的编码是gbk 这个是中文编码，最好的习惯呢就是我们再打开一个文件的时候 # 给它指定一个编码类型 # fobj=open('./Test.txt','w',encoding='utf-8') # # 开始操作读/写操作 # fobj.write('在苍茫的大海上') # fobj.write('狂风卷积着乌云') # fobj.write('在乌...

参与评论您还未登录，请先登录后发表或查看评论

python中utf 8_Unicode（UTF-8）在Python中读写文件

weixin_39641173的博客

12-15

240

我在理解文件的读写(Python2.4)方面有点大脑故障。# The string, which has an a-acute in it.ss = u'Capit\xe1n'ss8 = ss.encode('utf8')repr(ss), repr(ss8)("u'Capit\xe1n'", "'Capit\xc3\xa1n'")print ss, ss8print >> open(...

python utf 8_Python-Unicode（UTF-8）用Python读写文件

weixin_39597262的博客

11-24

180

我在理解将文本写入文件和将文件写入文件时遇到了大脑故障（Python 2.4）。# The string, which has an a-acute in it.ss = u'Capit\xe1n'ss8 = ss.encode('utf8')repr(ss), repr(ss8)（“ u'Capit \ xe1n'”，“'Capit \ xc3 \ xa1n'”）print ss, ss8pri...

python读写文件，和设置文件的字符编码比如utf-8

最新发布

09-19

在"xml.rar_UTF XML_UTF-8编码_utf_utf-8_xml utf-8"这个压缩包中，我们主要探讨的是与XML文档相关的编码问题，特别是UTF-8编码。 UTF-8是一种广泛使用的Unicode字符编码方案。它能够表示Unicode标准中的所有字符，...

Python利用 utf-8-sig 编码格式解决写入 csv 文件乱码问题

09-17

- **定义**：UTF-8-sig 是 UTF-8 编码的一个变种，它在文件开头添加了一个特殊的 BOM 标记。 - **特点**：BOM 标记的存在可以帮助某些软件（如 Excel）正确地识别文件的编码格式。 #### 四、为何写入 txt 文件时...

python utf 8-sig_Python利用 utf-8-sig 编码格式解决写入 csv 文件乱码问题

weixin_39793794的博客

12-15

526

先举个例子，分别以不指定编码、指定编码为 utf-8、指定编码为 utf-8-sig 三种方式来做比较，再将写入 csv 文件和 txt 文件来做个对比一、不指定编码方式，直接存入 csv 文件import csvwith open('test.csv', 'w') as fp:writer = csv.writer(fp)writer.writerow(['汉语', '俄语', '韩语', '日...

python批量读取文件名并写入txt文件中

09-18

脚本中还有一行代码 `reload(sys)sys.setdefaultencoding('utf-8')`，这行代码是为了设置Python解释器的默认编码为UTF-8。然而，这并不是推荐的做法，因为Python标准库不支持更改默认编码。在Python 3.x中，字符串...

python打开中文文本utf-8用不了_简单解决Python文件中文编码问题

weixin_35445090的博客

01-29

2919

读写中文需要读取utf-8编码的中文文件，先利用sublime text软件将它改成无DOM的编码，然后用以下代码：with codecs.open(note_path, 'r+','utf-8') as f:line=f.readline()print line这样就可以正确地读出文件里面的中文字符了。同样的，如果要在创建的文件中写入中文，最好也和上面差不多：with codecs.open(s...

Python读写unicode文件的方法

09-21

主要介绍了Python读写unicode文件的方法,涉及Python针对文件的读取及编码操作的相关技巧,具有一定参考借鉴价值,需要的朋友可以参考下

Python中对两种utf-8格式的理解

什么最重要？算法！！

05-12

1万+

博客核心内容：1、python文件开头utf-8格式的理解 2、程序中读取文件时utf-8格式的理解代码示例：#!/usr/bin/python # -*- coding:utf-8 -*-fr1 = open("goods_information", "r", encoding="utf-8") print(fr1.read())其中# -- coding:utf-8 --代表Python解释器

python unicode file read

清风名

08-28

291

def UnicodeReadFile(fileName): if os.path.exists(fileName) == False: #print fileName + ": Not exist" return ";" CODEC = 'utf-8' FILE = 'unicode.txt' emails = "" ...

python读取utf-8文件

sileiam的专栏

12-13

3985

在mac下python读取utf-8编码的txt文件，如果文件里有中文，直接输出的话会显示成乱码，也无法直接转成utf-8，所以必须想将其转成gbk，然后在转成utf-8 # -*- coding: utf-8 -*- import os filename = open(".txt") while True: s = filename.readline() if s

txt文件怎么创建_Python文件的读写

weixin_39979080的博客

11-21

1797

本节知识大纲：一、文件目录的基本操作说明：由于Windows和macOS文件目录系统的格式不同，在没有介绍到系统通配分隔符前，代码中的文件目录格式主要匹配macOS系统文件目录结构，下面是Python中常用的文件目录操作方法：1. 创建文件--mknod()方法和open()方法(1)mknod方法importos#创建文件file_path="./file_path.txt"o...

Python读取Unicode文本

KingZhang2000的博客

03-16

6476

#coding=utf-8 ''' 最近需要操作txt格式文档，用原本的文本读取方式不成功，于是搜索了一下找到原因。需要读取的目录下的文件有两种编码方式，一种是ANSI，另外一种是Unicode，但是Unicode的存储方式有UTF-8，UTF-16等，UTF即为Unicode Translation Format，就是把Unicode转做某种格式的意思。读取Unicode编码方式的文本时需...

python 应用unicode读写txt文件

备忘录

06-07

1536

今天要处理一个带希腊字母的文件，用ANSI文件格式只显示？在python中应用unicode编码就可以解决 import codecs#readfr=codecs.open(r.txt,r,utf-16)#writefw=codecs.open("w.txt","w",utf-16) 参考

python2下向文件写入unicode编码的内容，codecs包

weixin_30642267的博客

09-06

190

　　python内置库中的open方法只能读写ascii码，如果想写入Unicode字符，需要使用codecs包。 1 # -*- coding: utf-8 -*- 2 import codecs 3 import traceback 4 content = u'你好' 5 f = None 6 try: 7 f = codecs.open('c...

python文本编码转换_python3读取utf-8、gbk文件、编码转换、测试

weixin_39710966的博客

11-23

1305

平时用的最多的就是print输出看下效果，but 打印的时候老是能遇到知种编码报错这个字符不能编码那个字符不能解码等。下面就做个测试记录下看哪种情况下会报错执行环境cmd运行环境编码为936也就是gbkpycharm运行环境为utf-8python3编码说明先简单说下编码,unicode是国际统计的一种编码规范，utf-8就是使用这种规范实现的一种多字节编码。这个要搞清楚不清楚的自行搜索了解pyt...

深入理解Unicode与Python中文处理

"本文主要探讨Unicode在Python中的应用和中文处理，旨在帮助Python开发者理解Unicode、UTF-8等编码的区别，以及如何在Python中正确处理中文字符。文章内容包括Unicode编码的基本概念，以及与ASCII字符集的关系，...