关于编译和运行过程中的字符编码转换的猜测

最新推荐文章于 2021-12-19 04:44:36 发布

jingqi_se

最新推荐文章于 2021-12-19 04:44:36 发布

阅读量549

点赞数

分类专栏： C++ 文章标签：编译器 windows

本文链接：https://blog.csdn.net/jingqi_se/article/details/5323745

版权

C++ 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

(1)源代码编码方式 ---> (2)编译器处理的编码方式 ---> (3)目标程序中的字符串编码方式 --> (4)控制台等运行环境编码方式

(1) 源文件编码方式无所谓，只要编译器认得就行；所以可以使用各种编码格式。

(2) 编译器编译源文件之前，先将源文件转为统一的编码方式(毕竟编译器不可能为每种源文件编码方式都准备一套处理逻辑；另外，windows核心运行的是unicode，有可能编译器也是只处理unicode的)。这个时候源文件包括里面的字符串常量都已经变成编译器确定的统一编码了。

(3) 编译的过程中，多字节常量字符串(例如:"abc中文")嵌入到目标程序中时被转化为当前操作系统支持的编码，如 GB2312，于是目标程序中的多字节常量字符串成了GB2312编码的了(可以在调试的时候查看字符串内存的值，得以印证)。而宽字符常量字符串被转为UNICODE嵌入到程序中。

(4) 当目标程序运行时，还要看到是控制台当前显示字符的是用的什么编码。这个是可以用代码设置的，例如程序运行的时候调用 setlocal() , std::wcout.imbue(std::locale("chs"));等。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

jingqi_se

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

深入剖析go中字符串的编码问题——特殊字符的string怎么转byte？

新世界杂货铺

10-08

1808

来自公众号：新世界杂货铺文章目录前言问题unicode和utf-8的恩怨纠葛go中的字符go中的字符串是utf8编码的go中的rune理解go中的字符串其实是字节切片字符串的多种表示方式前言前段时间发表了Go中的HTTP请求之——HTTP1.1请求流程分析，所以这两天本来打算研究HTTP2.0的请求源码，结果发现太复杂就跑去逛知乎了，然后就发现了一个非常有意思的提问“golang 特殊字符的string怎么转成[]byte?”。为了转换一下心情，便有了此篇文章。问题原问题我就不码字了，直接上.

Python2.7字符编码详解

blue_lll的博客

08-09

1397

Python2.7字符编码详解目录 Python2.7字符编码详解声明一. 字符编码基础 1.1 抽象字符清单(ACR) 1.2 已编码字符集(CCS) 1.3 字符编码格式(CEF) 1.3.1 ASCII(初创) 1.3.2 MBCS/DBCS/ANSI(本地化) 1.3.3 Unicode(国际化) 1.4 字符编码方案(CES) 1.5 中文字符乱码(Mojibake) 1.5.1 ...

参与评论您还未登录，请先登录后发表或查看评论

字符编码原理

hitqiang

05-11

294

编码字符集与乱码问题根源之所在本文介绍了编码字符集的概念以及Java与编码字符集之间的关系，文章的内容来自于本人工作过程中的经验积累以及网络中的相关文章介绍，如果文章中有任何纰漏欢迎读者指正，让我们共同讨论学习J 1．字符字符是抽象的最小文本单位。它没有固定的形状（可能是一个字形），而且没有值。“A”是一个字符，“€”（德国、法国和许多其他欧洲国家通用货币的标志）也是一个字...

编译和编码

qq_40012479的博客

09-09

1794

几个概念：计算机中可见的字符都有一个二进制的机器编码与之对应。字符集可以理解为这种字符与二进制的对应关系的集合。编码是将字符转换为二进制的过程。解码与之相反。源码字符集：源码存储在计算机磁盘上所采用的编码方式。执行字符集：运行的程序中的字符在内存中存储所使用的编码方式。内部字符集：编译器内部使用的字符集。以gcc为例： -finput-charset 设置输入字符集，用于从输入的字符集转换，默认为utf8。 -fexec-charset=charset 设置执行字符集。决定了字符串常量在内存中

从编码到运行-程序编译过程详解

非典型技术宅的博客

12-09

1349

前言程序从一堆字符怎么变成一个可运行的程序呢，在这我们使用最简单的一个hello word 程序来演示程序的一个完整流程。在这过程中找到一些有用的调试方法，帮助我们在debug时快速解决问题。程序编译时的整体流程经过：编码、预处理、编译、汇编、链接运行环境 windows 10 + cygwin gcc 版本 7.4.0 一、编码按照C语言语法规则，将字符组合成一段有特定含义的文本。 main.c #include <stdio.h> char hello[]

c++ string取子串_一文教你Java字符串处理（String，StringBuffer，StringBuild）

weixin_39668898的博客

11-20

403

前言本文篇幅较长，但都是满满的干货，请大家耐心观看，相信会有不小的收获。本人在总结的过程中也收获了很多的知识，也希望大家可以一起借鉴学习下，希望大家最后都能有所收获！再言字符串的分类在java.lang包中,定义了两个大类来表示字符串: String和 String Buffer(StringBuild)类,它封装了字符串的数据结构,并定义了许多方法来处理字符串。Java将字符串分为两类的目的是为...

字符编码与gcc 编译器的编码问题

weixin_30312563的博客

09-07

667

最近在 vscode 中借助 gcc 编译器来配置 c 语言开发环境时，发现中文编码存在乱码问题。再加上最近学习到多字节字符与宽字符，搅在一起，搞得很乱，就把自己的理解写下来，供有需者参考吧。 1. 字符编码先来看维基中关于字符编码的描述字符编码字符编码（英語：Character encoding）、字集碼是把字符集中的字符编码为指定集合中某一对象（例如：比特模式、自然数序列、...

iOS App 的编译过程

热门推荐

KLTec.

11-22

1万+

在 iOS 开发的过程中，Xcode 为我们提供了非常完善的编译能力，你是否好奇在你按下 Command + R 的时候背后究竟发生了什么？

【VS2019】【PyQt】 Warning C4819: 该文件包含不能在当前代码页(936)中表示的字符。（附自己写的Python脚本完成文件编码批量转换）

weixin_44733774的博客

12-19

2173

这个问题，影响了我很长一段时间，很恶心很恶心，我用我那贫瘠的知识去分析，去想，去思考，这“当前代码页(936)”到底是个什么东西，到底在哪，为什么改不掉，为什么就不能让我选择代码页，我甚至在项目的属性页里头去设置了可能有用的东西，但还是不顶用，大半天在下饭都快把我自己给喂的撑死网上很多的垃圾办法是，修改源文件的编码，说是垃圾办法，是因为这完全就治标不治本。我当前情况是在VS2019撸码撸函数，然后把文件拖进QtCreator去跑去看实际运行结果。有时就会来个编码不正确的问题，一两次还好说，经常这样就很

C/C++语言拾遗（三）-多字节字符和Unicode

清凉简装的博客

07-23

753

MFC字符集选项 MFC字符集选项 Unicode Character Set与Multi-Byte Character Set有什么区别呢？ Multi-Byte Character Set一般是指ANSI（多字节）字符集，关于ANSI请参考第二小节字符集(Charcater Set)与字符编码(Encoding) 而Unicode Char...

字符，字节和编码

levin9的专栏

02-11

2557

级别：初级摘要：本文介绍了字符与编码的发展过程，相关概念的正确理解。举例说明了一些实际应用中，编码的实现方法。然后，本文讲述了通常对字符与编码的几种误解，由于这些误解而导致乱码产生的原因，以及消除乱码的办法。本文的内容涵盖了“中文问题”，“乱码问题”。引言“字符与编码”是一个被经常讨论的话题。即使这样，时常出现的乱码仍然困扰着大家。虽然我们有很多的办法可以用来消除乱码，但我们并

拨开字符编码的迷雾--编译器如何处理文件编码

词语大杂烩

09-01

200

1. Visual Studio字符集使用Visual Studio创建的C++工程可以在工程属性配置属性-->常规中配置字符集：使用Unicode字符集（默认）、使用多字节字符集。这个设置项不对字符编码产生直接的影响（注意这里的“直接”二字，第3节会说到），只会在工程属性配置属性-->C/C++-->预处理器加入相应的宏：使用Unicode字符集 --> _UNICODE和UNICO

c++ 字符串编码之间的转化

u012983289的博客

07-16

1885

static std::string UnicodeToAnsi(LPCWSTR pString) { char *pANSI = NULL; int nByte = 0; nByte = WideCharToMultiByte(CP_ACP, 0, pString, -1, NULL, 0, NULL, NULL); pANSI = (char*)malloc(nByte + ...

编译编码问题

qq_31635607的博客

08-18

282

将代码用notpad++打开，如果现实utf-8 bom,是编码问题，改为utf-8无bom格式保存即可

VS2017、windows、VVC参考代码VTM代码的编译和编码

TiramisuForever

11-23

3968

1、下载的代码在这一轮现在最近的时候3.0版本，可能到你的时候已经不是最近，你就进去下最新的代码就好了。下载链接如下： https://vcgit.hhi.fraunhofer.de/jvet/VVCSoftware_VTM 2、下载完成之后，解压，在代码目录下面新建一个build文件夹 3、然后打开命令窗口，切换到你的build目录下面，因为我的VS是2017,所以我在readm...

编译字符集问题

zzy090707的博客

11-29

622

MSVC，编译字符集、源字符集、运行字符集不一致的编译错误或乱码问题

字符编码之间的转换

代码人生

12-27

2648

字符编码介绍在严格的ASCII中，每个字元用7位元表示，一共规定了128个字符的编码； Unicode拓展自ASCII字元集，使用全16位字元集，可以表示全世界上所有的书写语言中可能用于电脑通讯的字元、象形文字和其他符号。但不支持一些古老的文字。 UTF-8是一种针对Unicode的可变长宽字符编码，又称为万国码（通用转换格式）。UTF-8用1到4字节编码Unicode字符。用在网页上可以

跨平台c/c++编码的预定义宏

景奇的专栏

11-02

2376

c/c++中编写跨平台的代码时，难免需要根据不同的操作系统、编译器等准备不同的代码。首先，不同平台中编译器预定义宏的参考资料点击这里其次，我本人仅关注以下平台：linux32/64-gcc, win32/64-vc, win32/64-mingw，这里给一个我自用的侦测上述平台的头文件 /** * @file - * @author jingqi * @date 2011-1

JAVA中文字符编码问题完全解析

"JAVA中文字符编码问题详解" 在Java编程中，中文字符编码问题是一个常见的困扰，尤其是在Web应用中。...通过深入理解字符编码转换过程，并针对性地调整各个步骤的编码设置，可以有效地避免和解决这些问题。