UTF8编码和其它编码之间的转化

本文的例子里的其它编码使用的是“西里尔文编码”,可以把“Windows-1251 ”改成你需要的编码,第一个函数是西里尔文编码转化成UTF8编码,第二个函数是UTF8编码转化成西里尔文编码,欢迎大家来交流。

 

    /// <summary>
    /// 西里尔文编码转化成UTF8编码
     /// </summary>
    public void XiLiErToUTF8()
    {
        Encoding xilier = Encoding.GetEncoding("Windows-1251");
        Encoding utf8 = Encoding.UTF8;

        StreamReader sr = new StreamReader(Server.MapPath("1doneW.txt"), xilier);
        string xilierinfo = sr.ReadToEnd();

        byte[] xilierBytes = xilier.GetBytes(xilierinfo);
        byte[] utf8Bytes = Encoding.Convert(xilier, utf8, xilierBytes);

        int len = utf8.GetCharCount(utf8Bytes, 0, utf8Bytes.Length);
        char[] utf8Chars = new char[len];
        utf8.GetChars(utf8Bytes, 0, utf8Bytes.Length, utf8Chars, 0);

        string utf8info = new string(utf8Chars);
        FileInfo file = new FileInfo(Server.MapPath("1doneW_utf8.txt"));
        if (file.Exists)
        {
            file.Delete();
        }

        using (StreamWriter sw = new StreamWriter(file.FullName, true, utf8))
        {
            sw.WriteLine(utf8info, Encoding.UTF8);
            Response.Write("西里尔文编码转化成UTF8编码已完成<br/>");
        }
    }


    

    /// <summary>
    /// UTF8编码转化成西里尔文编码
     /// </summary>
    public void UTF8ToXiLiEr()
    {
        Encoding utf8 = Encoding.UTF8;
        Encoding xilier = Encoding.GetEncoding("Windows-1251");

        StreamReader sr = new StreamReader(Server.MapPath("1doneU.txt"), utf8);
        string utf8info = sr.ReadToEnd();

        byte[] utf8Bytes = utf8.GetBytes(utf8info);
        byte[] xilierBytes = Encoding.Convert(utf8, xilier, utf8Bytes);

        int len = xilier.GetCharCount(xilierBytes, 0, xilierBytes.Length);
        char[] xilierChars = new char[len];
        xilier.GetChars(xilierBytes, 0, xilierBytes.Length, xilierChars, 0);

        string xilierinfo = new string(xilierChars);
        FileInfo file = new FileInfo(Server.MapPath("1doneU_xilier.txt"));
        if (file.Exists)
        {
            file.Delete();
        }

        using (StreamWriter sw = new StreamWriter(file.FullName, true, xilier))
        {
            sw.WriteLine(xilierinfo);
            Response.Write("UTF8编码转化成西里尔文编码已完成<br/>");
        }

    }


 

   1doneW.txt里面放置的是西里尔文编码的文字

   1doneU.txt里面放置的是UTF8编码的文字

   附件:源代码下载

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在C++中,u8字符串字面量(即以u8开头的字符串)可以用于表示UTF-8编码的字符串。如果你已经有一个使用国标编码(GB2312或GBK)表示的字符串,可以使用一些库来将其转换为UTF-8编码。 例如,使用iconv库可以很方便地进行编码转换。以下是一个使用iconv库将国标编码字符串转换为UTF-8编码字符串的示例: ```cpp #include <iostream> #include <string> #include <iconv.h> int main() { std::string gb_str = "你好,世界!"; // 使用国标编码表示的字符串 std::string utf8_str; // 转换后的UTF-8编码字符串 iconv_t conv = iconv_open("UTF-8", "GB18030"); // 创建一个转换句柄 if (conv == (iconv_t)(-1)) { std::cerr << "Failed to create conversion handle." << std::endl; return 1; } char* gb_ptr = const_cast<char*>(gb_str.c_str()); std::size_t gb_len = gb_str.length(); char utf8_buf[1024]; char* utf8_ptr = utf8_buf; std::size_t utf8_len = sizeof(utf8_buf); int result = iconv(conv, &gb_ptr, &gb_len, &utf8_ptr, &utf8_len); // 进行编码转换 if (result == -1) { std::cerr << "Failed to convert encoding." << std::endl; return 1; } utf8_str.assign(utf8_buf, sizeof(utf8_buf) - utf8_len); // 从转换后的缓冲区中取出转换后的字符串 iconv_close(conv); // 关闭转换句柄 std::cout << "gb_str: " << gb_str << std::endl; std::cout << "utf8_str: " << utf8_str << std::endl; return 0; } ``` 需要注意的是,在进行编码转换时要确保源字符串的编码和目标编码是正确的,否则可能会得到错误的结果。在上面的示例中,我们将源编码设置为GB18030,这是GB2312和GBK的超集,通常也可以用于表示这两种编码

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值