批量转换文件编码格式的方法

在开发的时候,有时会出现:该文件包含不能在当前代码页(936)中表示的字符。请将该文件保存为 Unicode 格式以防止数据丢失

并且文件非常多,想要批量或一键就完成文本文件的编码格式转换,有如下方法,第三种方法最方便。

  1. Visual Studio Code

    • 打开 Visual Studio Code,并在左侧资源管理器中打开需要转换编码的目录。
    • 选择需要转换编码的文件,然后点击底部状态栏中的编码,选择“保存时使用另存为”,然后选择“utf-8 with BOM”或者“utf-8”。
    • 重复以上步骤,直到将所有需要转换的文件的编码都修改为UTF-8格式。
  2. Notepad++

    • 打开 Notepad++,然后依次点击“文件” -> “打开”来打开需要转换编码的文件或者目录。
    • 选择需要转换编码的文件,然后点击“格式” -> “转为 UTF-8”来将文件编码转换为UTF-8格式。
    • 重复以上步骤,直到将所有需要转换的文件的编码都修改为UTF-8格式。
  3. PowerShell 脚本: 使用命令行批量转换文件编码,可以编写一个PowerShell脚本来实现。如下在powershell命令行中执行:

    Get-ChildItem -Path "your_directory_path" -Filter "*.txt" | ForEach-Object { $fileContent = Get-Content $_.FullName -Raw Set-Content -Path $_.FullName -Value $fileContent -Encoding UTF8 }

    "your_directory_path" 替换为转换的目录路径。该脚本将会批量将目录中的所有.txt文件转换为UTF-8编码。可以根据需要修改文件过滤器和编码类型。

以上是一些常用的方法和工具,可以根据自己的偏好选择其中之一来完成文件编码的转换。

  • 10
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
项目中有很多文件因为编码的原因导致用户使用的时候看到的是乱码,或是不兼容的情况,网上找了一圈 也没有适合咱程序员的转码的工具,所以写了一个批量转换工具 虽然已经使用在我司生产项目中,但还是建议你转换前备份一次文件 注意(使用前必看): 注意(使用前必看): 注意(使用前必看): 支持所有文本格式的文档(如 txt,js,css,java,c..),二进制或程序(如word,excel,exe文件)不要使用本转换工具,因为是JAVA程序 需要你的机器上已经安装了JDK 使用方法: 1,打开start.sh文件,windows用户把扩展名.sh修改为.bat 2,修改三个双引号("")中的参数, 第一个参数是文件夹路径, 第二个参数表示要转换成的编码 如utf-8,utf-8-bom,ansi 等编码都支持 第二个参数表示要转换文件类型,以扩展名的形式提供支持,可以提供多个文件扩展名 以空格分隔 如:我要转换E盘下 E:\work_architecture\doc目录下的所有js 和 css 文件 编码为 utf-8 那么,你要执行的命令就是 java -jar code_conversion.jar "E:\work_architecture\doc" "utf-8" ".js .css" 还是挺简单的吧~~ 支持的功能: 1,批量转换,子目录自动发现 2,文件编码自动识别,所以使用的时候不用提供原文件的编码;识别不了不会转换,保证项目文件的安全 3,支持utf-8-bom编码 4,兼容Linux & Windows & Mac系统 5,不用安装,只要机器有JDK就可以使用 需要源码的请邮件jidaqiana@163.com 或 私信我
批量修改csv文件编码格式,首先来解释一下编码格式编码格式是一种将字符转换成二进制数字的规则,不同的编码格式使用不同的规则进行转换。在Python中,我们可以使用csv模块来读取和写入csv文件。 要批量修改csv文件编码格式,我们可以按照以下步骤进行操作: 1. 导入所需的模块:首先,要修改编码格式,我们需要导入csv和codecs模块。csv模块用于读取和写入csv文件,codecs模块用于处理编码格式转换。 2. 创建一个文件名列表:我们需要获取所有要修改的csv文件文件名列表。可以使用os模块的listdir函数来获取指定目录中的所有文件名。 3. 循环遍历文件名列表:使用一个for循环来遍历文件名列表,并对每个文件进行编码格式的修改操作。 4. 打开文件并读取内容:使用csv模块的reader函数打开csv文件,并通过循环遍历每一行来读取文件内容。 5. 修改编码格式并写入新文件:使用codecs模块的open函数以新的编码格式打开文件,并将读取的每一行写入新文件。 6. 关闭文件:在修改完成后,关闭原来的文件和新文件。 下面是一个示例代码片段,用于批量修改csv文件编码格式为utf-8: ```python import csv import codecs import os # 创建一个文件名列表 file_list = os.listdir("文件夹路径") # 循环遍历文件名列表 for file_name in file_list: # 打开原文件和新文件,使用utf-8编码格式 with codecs.open("文件夹路径/" + file_name, "r", encoding="原编码格式") as csv_file: with codecs.open("文件夹路径/" + file_name + "_new", "w", encoding="utf-8") as new_csv_file: # 读取原文件内容并写入新文件 csv_reader = csv.reader(csv_file) csv_writer = csv.writer(new_csv_file) for row in csv_reader: csv_writer.writerow(row) # 关闭原文件和新文件 csv_file.close() new_csv_file.close() ``` 请注意替换示例代码中的"文件夹路径"为你要操作的文件夹路径,同时将"原编码格式"替换为你的csv文件的当前编码格式。 这就是使用Python批量修改csv文件编码格式的基本步骤。你可以根据具体的需求做一些修改,比如控制文件名的命名规则、处理不同的编码格式等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值