pythpn zip解压

最新推荐文章于 2022-11-15 16:20:18 发布

J_PrCz

最新推荐文章于 2022-11-15 16:20:18 发布

阅读量242

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/Jingnian_destiny/article/details/90296456

版权

Python 专栏收录该内容

30 篇文章 0 订阅

订阅专栏

Zip文件解压以及TXT的读取

1.对Zip 通过python进行解压，使用的是zipfile库
解压函数是zipfile.ZipFile()
将解压后的文件提取到path1路径使用extractall()函数

import zipfile
path = 'a.zip'
path1 = 'c:/'
f = zipfile.ZipFile(path, 'r')
f.extractall(path1)
f.close()

2.提取某一文件的 . 的前缀
使用re库, 通过findall()来提取前缀

import re
path1 = 'd:/LJ/cs/20190517data/a.txt'
m = re.findall(r'(.+?)\.', path)
print(m)

输出m可以得到

['d:/LJ/cs/20190517data/a']

3.TXT中含有中文时怎么读取
当.txt文件中含有中文的时候，会报错，比如：

path = 'd:\M22.txt'
f1 = open(path, 'r', encoding='utf-8')
a = f1.read()

运行上述的代码会出现错误：

Traceback (most recent call last):
File “<pyshell#2>”, line 1, in
a = f1.read() File “C:\Users\Administrator\AppData\Local\Programs\Python\Python37\lib\codecs.py”, line 322, in decode (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xca in position 7: invalid continuation byte
针对报错的问题，进行了网页答案解决，发现在这方面大家出现的问题都不太一样，所以试着进行了解决，如下，可以解决上述问题：

path = 'd:\M22.txt'
f1 = open(path)
a = f1.read()

但是，又有的时候，如果你直接使用f1.read(path)读取文本的时候，会报错：

path1 = 'd:/FD03.txt'
f1 = open(path1)
a = f1.read()

运行上述代码，会出现这样的错误：
Traceback (most recent call last):
File “<pyshell#5>”, line 1, in
a = f1.read()
UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xac in position 36: illegal multibyte sequence
这时候需要编码，所以对应的改进是：

f1 = open(path1, encoding='utf-8')
a = f1.read()

4.异常处理
由于我需要对很多歌文本文件进行处理，不能一个一个试，所以使用了异常处理解决上边出现的问题：
异常处理，使用的try: 和except:

import pandas as pd
import os

path1 = 'd:/LJ/9_txt/'
file_list = os.listdir(path1)
for i in file_list:
    print(i)
    try:
        f1 = open(path1 + i, 'r', encoding='utf-8')
        a = f1.read()
        a = a.split('\n')
        f1.close()
    except:
        f1 = open(path1+i)
        a = f1.read()
        f1.close()