Python小记--二进制方式文件读写实践

二进制文件读写探究

昨天的文件读写简洁方案使用了with语法代替try…except….finally进行文本文件读写,今天补充一下读写二进制文件内容。
其实所有文件都可以当做二进制文件来处理,至于为什么会有文本文件和二进制文件的说法,个人认为是为了进行逻辑上的区分吧~这个今天先不去探究。
我选取了两种文件类型,.docx和.jpg来进行测试:

.docx格式:

word其中包含了文字和图片,模仿昨天代码,复制一个docx文件如下:

with open('file/python.docx', 'rb') as f:
    with open('file/pythonCopy.docx', 'wb') as w:
        for line in f.readlines():
            w.write(line.strip())
print('done.')

经测试,控制台打印了”done.”,说明程序并没有报错并且成功执行完毕。
但是当我尝试打开pythonCopy.docx文件时,却报出以下错误:

可恶的错误

随后我比较了一下两个文件的大小,发现都是一样的31kb,并且我想由于采用的二进制方式读取和写入,就不应该存在文件编码的问题。于是再次思考程序的执行过程:

  1. 读取文件,正常;
  2. 创建输出流,没有报错所以也应该是正常的;
  3. 写入新文件,文件大小一致,所以写入的数据应该是没错的,但是写入方式呢?不懂所以回头检查一遍!

于是发现了一个问题,我的写入语句如下:

w.write(line.strip())

猛然发现在这里我调用了strip()方法,这个方法作用是去除字符串首尾的空格,类似java中的trim()方法,问题很可能就出在这里!二进制数据被篡改导致文件损坏!
去掉一试,大功告成!

.jpg文件

要说二进制文件,图片和视频才是货真价实毫无争议的二进制文件,此处不应有大问题,代码如下:

with open('file/python.jpg', 'rb') as f:
    with open('file/pythonCopy.jpg', 'wb') as w:
        for line in f.readlines():
            w.write(line)
print('done.')

此次完美复制!

踏平一切坑!2017年8月15日20:39:43 于辉煌时代


  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 二进制文件是一种以二进制形式存储数据的文件,与文本文件不同,它们不包含任何格式化的文本,而是包含计算机可以直接理解的二进制数据。在Python中,我们可以使用内置的open()函数来二进制文件。 要打开一个二进制文件,我们需要将文件模式设置为“rb”(二进制文件)或“wb”(二进制文件)。例如,要打开一个名为“example.bin”的二进制文件进行取,我们可以使用以下代码: ``` with open("example.bin", "rb") as f: data = f.read() ``` 这将打开“example.bin”文件并将其内容取到变量“data”中。我们可以使用相同的方式二进制文件: ``` with open("example.bin", "wb") as f: f.write(data) ``` 这将把变量“data”中的内容入到“example.bin”文件中。请注意,二进制文件时,我们需要确保我们入的数据是二进制数据,而不是字符串或其他格式的数据。 ### 回答2: Python中的文件操作是非常重要的,许多常见的编程任务都涉及文件。其中,二进制文件更是需要特别注意。 二进制文件是指保存在计算机上的文件,其内容以二进制形式存储。相对于文本文件二进制文件通常更小,更快,并且可以直接访问文件中的任意位置。常见的二进制文件有图片、视频、音频等。 Python提供了许多函数来取和二进制文件。 开始讲解二进制文件取。打开二进制文件的过程与打开文本文件相同,只需要在打开文件时指定打开方式为“rb”(二进制文件)。文件内容时采用read()函数进行取,它将取整个文件的内容并将其作为一个字符串返回。read()函数还接受一个参数,表示要取的最大字节数。如果不传入该参数,则取整个文件二进制文件的示例代码如下: ```python with open("binary_file", "rb") as f: contents = f.read() # 取整个文件 print(contents) ``` 接下来是二进制文件入。与取类似,打开文件时需要指定打开方式为“wb”(二进制文件)。文件的内容可以使用write()函数进行入,它接受一个二进制字符串作为参数,并将其文件二进制文件的示例代码如下: ```python with open("binary_file", "wb") as f: f.write(b"Hello, world!") # 入字符串 ``` 需要注意的是,二进制文件时需要使用二进制字符串(即在字符串前面加b),否则Python会将字符串转换为ASCII编码并文件,这样就无法正确地二进制数据了。 除了取和入整个文件,我们还可以使用seek()函数在二进制文件中定位到指定位置,并从该位置开始取或入数据。seek()函数接受两个参数,第一个参数表示要跳过的字节数,第二个参数表示跳跃的起点。如果第二个参数为0,则以文件起始位置为起点;如果为1,则以当前位置为起点;如果为2,则以文件末尾为起点。示例代码如下: ```python with open("binary_file", "rb") as f: f.seek(5) # 跳过前5个字节 contents = f.read(10) # 取10个字节 print(contents) with open("binary_file", "wb") as f: f.seek(5, 0) # 跳到第5个字节 f.write(b"World") # 向文件入"World" ``` 通过上述介绍,我们知道了Python二进制文件的方法及注意事项,希望这篇文章对初学者有所帮助。 ### 回答3: Python文件是程序中非常基础和常用的一项功能。文件可以分为文本文件二进制文件二进制文件和文本文件不同的是,二进制文件并不是由一些可的字符组成,而是由计算机能够识别的比特流组成,因此在二进制文件时需要使用二进制模式的文件操作。 在Python中,我们可以使用open()函数打开一个文件,而如果要打开二进制文件,需要在文件名的第二个参数中添加'b'。比如,我们可以使用以下代码取一个二进制的图片文件: ```python with open('image.png', 'rb') as f: img_data = f.read() ``` 上述代码中,以二进制模式打开了一个名为image.png的文件,将文件中的内容取到了一个变量img_data中。在取完毕之后,使用with语句自动关闭了文件。 当我们要二进制文件时,我们也需要使用二进制模式的文件操作。比如,我们可以使用以下代码将一个字节串入一个二进制文件中: ```python with open('binary.bin', 'wb') as f: f.write(b'\x00\x01\x02\x03') ``` 上述代码中,使用with语句打开了一个名为binary.bin的文件,并使用二进制模式打开,将一个字节串b'\x00\x01\x02\x03'入了文件中。在入完毕之后,使用with语句自动关闭了文件。 需要注意的是,二进制文件中包含的数据需要按照特定的格式进行解析才能正确取。比如,在取一个位图文件时,需要先文件头(header)中的各项属性,然后根据这些属性去解析文件中的像素数据。这就需要我们使用Python中的结构体(struct)模块,按照特定的格式二进制数据。例如: ```python import struct with open('bitmap.bmp', 'rb') as f: # 文件头 header = f.read(14) # 解析文件头 _, _, _, _, _, size, _, _, _, offset = struct.unpack('<2sIHHI', header) # 取像素数据 f.seek(offset) data = f.read(size - offset) ``` 上述代码中,使用struct.unpack()解析了一个长度为14的文件头(header),然后根据header中的信息取了像素数据。其中'<2sIHHI'用于表示不同属性的长度和类型,具体可以参考Python官方文档。 在处理二进制文件时还需要注意一些常见的问题,比如在取或文件时,需要注意字节序(endian)的问题,需要进行正确的错误处理等。 总之,学习如何二进制文件Python编程中很重要的一环,可以帮助我们更好地处理计算机中的数据和文件
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值