Qt读取UTF8与GBK格式文件乱码问题

194 篇文章 109 订阅

window下文件一般为GBK格式文件,而Linux系统下文件一般为UTF8文件,当文件读取格式不匹配时,读取到的数据显示为乱码,所以需要转码.

GBK格式文件读取

QFile file("GBK.txt");
file.open(QFile::ReadOnly | QFile::Text);
QTextCodec *codec = QTextCodec::codecForName("GBK");
QString content = codec->toUnicode(file.readAll());
qDebug()<<"Display GBK.txt file"<<content;

UTF8格式文件读取

QFile file("UTF8.txt");
file.open(QFile::ReadOnly | QFile::Text);
QTextCodec *codec = QTextCodec::codecForName("UTF8");
QString content = codec->toUnicode(file.readAll());
qDebug()<<"Display UTF8.txt File: "<<content;

输出

Display GBK.txt file "Hello world
中文
" 
Display UTF8.txt File:  "Hello world
你好
" 

注意

  • 使用QTextCodec前需要先构造QCoreApplication类或其派生类否则转码不成功.

源文件

#include <QCoreApplication>
#include <QFile>
#include <QTextCodec>
#include <QDebug>

static void displayGBKFile()
{
    QFile file("GBK.txt");
    file.open(QFile::ReadOnly | QFile::Text);
    QTextCodec *codec = QTextCodec::codecForName("GBK");
    QString content = codec->toUnicode(file.readAll());
    qDebug()<<"Display GBK.txt file"<<content;
}

static void displayUTF8File()
{
    QFile file("UTF8.txt");
    file.open(QFile::ReadOnly | QFile::Text);
    QTextCodec *codec = QTextCodec::codecForName("UTF8");
    QString content = codec->toUnicode(file.readAll());
    qDebug()<<"Display UTF8.txt File: "<<content;
}

int main(int argc, char *argv[])
{
    QCoreApplication a(argc, argv);

    displayGBKFile();
    displayUTF8File();

    return a.exec();
}

源码地址

https://github.com/myqtdemo/QtUTF8AndGBKCoding.git
当你使用Qt(跨平台应用程序框架)来读取包含中文的.txt文件时遇到乱码,通常是因为文件编码未被正确识别。Qt默认处理文本文件会假设UTF-8编码,但如果文件实际使用的是其他如GBK、Big5等中文编码,就会出现问题。 解决这个问题,你需要确保以下几个步骤: 1. **打开文件时指定正确的编码**: 使用QTextStream或者 QFile 的`open()`方法时,明确指定文件编码。例如: ```cpp QFile file("your_file.txt"); QTextCodec *codec = QTextCodec::codecForName("UTF-8"); if (!file.open(QIODevice::ReadOnly | QIODevice::Text)) { qDebug() << "Failed to open the file"; } else { QTextStream in(&file, codec); QString content = in.readAll(); // 现在content应该是一个正确解析后的字符串 } ``` 2. **检查文件编码**: 在编写或转换文件时,确认文件已经被保存为UTF-8编码。如果你是从其他编码转换过来的,可能需要使用相应的工具(比如Notepad++的“批量转换字符集”功能)将文件转换为UTF-8。 3. **异常处理**: 如果不确定原始文件的编码,可以尝试几种常见的编码进行检测,直到找到正确的那一项。 4. **使用QTextDecoder解码**: 如果文件已经打开,你可以创建一个QTextDecoder实例,然后解码读取的内容: ```cpp QTextStream in(&file); QByteArray bytes = in.readAll(); QTextDecoder decoder; QString decodedContent = decoder.toUnicode(bytes); ``` 如果以上步骤都做了还是有乱码,那可能是数据损坏或者其他原因引起的,建议检查文件是否完整,并确保源文件生成过程中没有意外编码转换。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值