python一次性读取不同编码格式的txt文件

蒸开水

已于 2022-07-20 14:19:22 修改

阅读量1.2k

点赞数 1

文章标签： python

于 2022-07-18 18:41:38 首次发布

本文链接：https://blog.csdn.net/zimkeavin/article/details/125857179

版权

import os
import chardet

# 获取文件编码类型
def get_encoding(file):
    # 二进制方式读取，获取字节数据，检测类型
    with open(file, 'rb') as f:
        return chardet.detect(f.read())['encoding']


for file in os.listdir("D:\test"):
    encoding = get_encoding("D:\test" + '\\' + file)
    with open("D:\test" + '\\' + file, "r", encoding=encoding,errors='ignore') as f:
       str1 = f.read()
       print(str1)

代码是在我原需求上提取修改出来的，没再测试，不过大致思路是这样没错。

有时候就算根据txt的编码来读取一样会报错，我遇到的直接加个if判断修改encoding即可，不确定其他适用性。作为个思路参考。注意有些txt用utf-8-sig而不是utf-8。

 if encoding == 'Windows-1254':
     encoding = 'GB2312'

参考：python 获取文件字符编码类型_浅醉樱花雨的博客-CSDN博客_python获取文件编码

Python——with open()的用法_m0_48936146的博客-CSDN博客_python withopen

优惠劵

蒸开水

关注关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
python一次性读取不同编码格式的txt文件

python一次性读取某文件夹内编码不同的txt
复制链接

扫一扫

易语言-易语言实现文件编码检测

06-25

易语言实现文件编码检测

python读写文件格式_python 读写文件包含多种编码格式的解决方式

weixin_39915668的博客

11-29

143

今天写一个脚本文件，需要将多个文件中的内容汇总到一个txt文件中，由于多个文件有三种不同的编码方式，读写出现错误，先将解决方法记录如下：# -*- coding: utf-8 -*-import waveimport pylab as plimport numpy as npimport pandas as pdimport osimport timeimport datetimeimport a...

参与评论您还未登录，请先登录后发表或查看评论

Python文件处理和常见的异常

01-20

前言在实际的开发过程中会经常要将数据作持久化处理，通常的做法是将数据从内存写到磁盘文件中本文将带你学习Python对于文件的读写操作，以及在如何保证代码的健壮性和容错性；异常的捕获必不可少，这里仅列举一些常见的异常 python中使用open内置函数来打开文件，可以指定文件名（相对路径和绝对路径）、操作模式（读/写/追加）、编码格式（一般为utf-8). 读写文本文件读写文件一般使用open方法，也可以使用 with open()； with关键字指定文件对象的上下文环境并在离开上下文环境时自动释放文件资源 一次性读取整个文件的内容，适合文件数量比较小的情况。 def main():

python读取不同编码格式的txt文件

weixin_44806146的博客

09-21

1309

python读取不同编码格式的txt文件

python读写不同编码txt文件

热门推荐

大头爸爸的博客

09-24

9万+

以后整理规范 import os import codecs filenames=os.listdir(os.getcwd()) out=file("name.txt","w") for filename in filenames: out.write(filename.decode("gb2312").encode("utf-8")) out.close() 将执行文件的当

Python中读取与写入文件时的编码方式

hou09tian的博客

07-06

2425

在与中提到通过文件对象调用read()函数和write()函数实现文件的读写。以上方法能够正确地取或写入英文时，当要读写的内容是中文时，则需要考虑编码方式。

python处理多种编码格式的txt文件

pursuit_zhangyu的博客

04-07

3176

问题一般会出现的问题 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd6 in position 0: invalid continuation byte UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 2: illegal multibyte sequence 主要原因是：文件夹中的txt文件包含不同种的编码格式。如何查看txt文件的编码格式：

python3 关于windows-1254解码

l1648027768的博客

04-25

3140

python3 windows-1254解码网上找了下，居然没有解决方案，直接干货，上代码 >> if type(str1) == “windows-1254”: ret = str1.decode(‘gbk’, errors=‘ignore’) print(ret) // errors=“ignore” 是忽略在解码过程中遇到的错误 ...

python文件操作、编码转换

qq_34577961的博客

02-19

1552

open打荆模式 ''' r:只读模式，默认 a:追加模式，原有基础上加数据 x:创建一个新文件，存在文件会报错 b:二进制模式，针对图片，音频等 ''' open(file,mode='r')

Python 科学计算

09-20

2.3.3 一个复杂的例子.........................51 2.3.4 布尔数组作为下标.....................53 2.4 庞大的函数库 ............................... 54 2.4.1 求和、平均值、方差.................54 2.4.2 最值...

code-20210420-Sumanta::check_mark:Python BMI计算器编码挑战

04-20

用户可以通过JSON格式（一次10万个数据集）提供多个数据集。程序将以相同的JSON格式返回输出。必要的图书馆：大熊猫麻木操作系统 json 如何安装：请在命令提示符下执行以下命令。点安装-r requirements....

Python Cookbook

07-31

1.18 一次完成多个替换 36 1.19 检查字符串中的结束标记 39 1.20 使用Unicode来处理国际化文本 40 1.21 在Unicode和普通字符串之间转换 43 1.22 在标准输出中打印Unicode字符 45 1.23 对Unicode数据编码并用于...

Python核心编程第二版(ok)

05-21

Python核心编程第二版(ok) 第1部分　Python核心　第1章　欢迎来到Python世界　　1.1　什么是Python　　1.2　起源　　1.3　特点　　1.3.1　高级　　1.3.2　面向对象　　1.3.3　可升级　　1.3.4　可扩展　　...

SpringBoot中实现发送邮件

最新发布

hac1322的博客

04-30

642

当你添加了spring-boot-starter-mail依赖后，Spring Boot会自动配置JavaMailSender实例，并根据application.yml文件中的属性来配置这个实例。你可以直接在需要发送邮件的地方通过@Autowired注解将JavaMailSender实例注入到你的类中，然后使用它来发送邮件。：首先，需要在你的pom.xml文件中添加Spring Boot的邮件发送器依赖。，简化了在Spring Boot应用程序中发送电子邮件的设置过程。Spring Boot的。

python学习笔记----循环语句（四）

取个名字太难了a的博客

04-28

1111

随机数种子在生成随机数的过程中起到一个非常重要的作用。它是用于初始化随机数生成算法（伪随机数生成器）的初始值。随机数种子的作用可重复性：当你使用特定的种子值初始化随机数生成器时，即使在不同的运行环境或不同时间，生成的随机数序列都将是相同的。这对于调试和测试非常重要，因为它允许程序的行为在使用随机数时保持一致。控制随机性：种子提供了一种方法来控制随机数生成过程。通过改变种子，你可以获得不同的随机数序列，这对于模拟和其他需要随机输入的应用非常有用。

python复习（三）

qq_43710593的博客

04-29

430

类是一种面向。

链表刷题集

yajunjiao的专栏

04-30

813

本文主要列举了一些刷的题，不多，有那么几道，也建议各位去建立自己的刷题集。积少成多。

【python】python基础1

七月尘上

04-29

452

注释：单行注释：#多行注释：“”“”“”批量注释：ctl+?,取消注释继续执行一次就行标识符命名规范：1、变量名、类名、函数名只能由数字、字母、下划线组成2、不能以数字开头3、严格区分大小写4、不能以关键字命名定义变量的方式：1、var1 = 值12、var1,var2=值1，值23、var1,var2=值1交换两个变量的值：输出命令解析：sep:输出内容以什么进行分割end:输出以什么结尾file:输出内容以文件形式输出到指定文件。

python基础知识

2301_77724654的博客

04-28

484

基本输入input()，若要输出整数或小数，可用int()，float()函数进行数据类型转换。缩进：Python使用缩进表示代码块，连续的具有相同缩进的多条语句为一个代码块，语句末尾为代码块的开头，同一个代码块要有相同的缩进。1 在Python3中，print()函数取代了Python2中的print语句。2 Python中程序文件运行方式为程序文件运行，交互式运行两种。赋值语句，简单赋值与序列赋值等，序列赋值可一次为多个变量赋值。注释：单行注释用#，多行注释用'''或'''''''

python读取txt文件

09-18

`readlines()`方法可以一次性读取整个文件的内容，并返回一个列表，列表的每个元素都是文件的一行内容。使用`for`循环遍历列表，即可逐行输出文件内容。 ### 回答2： Python读取txt文件的一种常用方法是使用`open...

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交