linux将usascii转化为utf8,强制编码从US-ASCII到UTF-8(iconv)(Force encode from US-ASCII to UTF-8 (iconv))...

强制编码从US-ASCII到UTF-8(iconv)(Force encode from US-ASCII to UTF-8 (iconv))

我正在尝试将一堆文件从US-ASCII转码为UTF-8。

为此,我使用iconv:

iconv -f US-ASCII -t UTF-8 file.php > file-utf8.php

Thing是我的原始文件是US-ASCII编码,这使得转换不会发生。 显然是因为ASCII是UTF-8的一个子集

http://www.linuxquestions.org/questions/linux-software-2/iconv-us-ascii-to-utf-8-or-iso-8859-15-a-705054/

引用:

在引入非ASCII字符之前,不需要显示文本文件

真正。 如果我在文件中引入一个非ASCII字符并保存它,那么就说用Eclipse,文件编码(charset)被切换到UTF-8。

在我的情况下,我想强制iconv将文件转码为UTF-8 。 是否有非ASCII字符?

注意:原因是我的PHP代码(非ASCII文件...)处理一些非ASCII字符串,这会导致字符串不被很好地解释(法语):

伊丽莎白二世

Barillé(Procidis),1

...

编辑

US-ASCII 是 UTF-8一个子集(见下面的Ned的答案 )

意思是US-ASCII文件实际上是以UTF-8编码的

我的问题来自别的地方

I'm trying to transcode a bunch of files from US-ASCII to UTF-8.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在 C++ 中,将 ASCII 编码的字符串转换为 UTF-8 编码的字符串有多种方式,以下是其中的两种方式: 1. 使用 `iconv` 库 ```c++ #include <iconv.h> #include <cstring> #include <iostream> int main() { std::string asciiStr = "Hello, world!"; // ASCII 编码的字符串 std::string utf8Str; size_t inBytesLeft = asciiStr.size(); size_t outBytesLeft = inBytesLeft * 2; // 预留足够的空间 char* inBuf = const_cast<char*>(asciiStr.c_str()); char* outBuf = new char[outBytesLeft]; memset(outBuf, 0, outBytesLeft); iconv_t cd = iconv_open("UTF-8", "ASCII"); // 创建转换句柄 iconv(cd, &inBuf, &inBytesLeft, &outBuf, &outBytesLeft); // 进行转换 utf8Str = outBuf; iconv_close(cd); // 关闭转换句柄 delete[] outBuf; std::cout << utf8Str << std::endl; // 输出 UTF-8 编码的字符串 return 0; } ``` 在上述代码中,我们使用 `iconv` 库来完成 ASCII 到 UTF-8 的转换。首先,我们创建一个 `iconv_t` 类型的转换句柄,然后调用 `iconv` 函数进行转换。注意,在调用 `iconv` 函数之前,需要将输入和输出缓冲区的剩余空间大小传递给函数。转换完成后,我们将转换后的 UTF-8 编码的字符串存储到 `utf8Str` 变量中,最后输出到控制台上。 2. 使用 `UTF8-CPP` 库 ```c++ #include <string> #include <iostream> #include "utf8.h" int main() { std::string asciiStr = "Hello, world!"; // ASCII 编码的字符串 std::string utf8Str; utf8::utf8to16(asciiStr.begin(), asciiStr.end(), std::back_inserter(utf8Str)); // 进行转换 std::cout << utf8Str << std::endl; // 输出 UTF-8 编码的字符串 return 0; } ``` 在上述代码中,我们使用 `UTF8-CPP` 库来完成 ASCII 到 UTF-8 的转换。我们调用 `utf8::utf8to16` 函数将 ASCII 编码的字符串转换为 UTF-16 编码的字符串,然后通过 `std::back_inserter` 将转换后的 UTF-8 编码的字符串存储到 `utf8Str` 变量中,最后输出到控制台上。需要注意的是,使用 `UTF8-CPP` 库需要包含相应的头文件 `utf8.h`。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值