C++字符编码

本文探讨了C++中不同字符编码的区别,如GB2312和Unicode,并通过示例展示了`char`和`wchar_t`类型的字符串长度差异。同时,介绍了Python中默认的UTF-8编码以及处理含有汉字的文件时可能出现的编码问题。内容涉及字符编码的基础知识和在实际编程中的应用。
摘要由CSDN通过智能技术生成
#include<iostream>
using namespace std;

void main()
{
	char str1[] = "我是";					//默认是GB2312编码,一个字节表示字母,两个字节表示汉字
	cout << sizeof(str1) << endl;			//输出 5
	char str2[] = "aa我是";					//
	cout << sizeof(str2) << endl;			//输出 7
	wchar_t str3[] = L"aa我是";	
	cout << sizeof(str3) << endl;			//输出 10 '\n'也是采用unicode编码  //加上了L后,使用定长编码,所有字符用2个字节表示 wchar_t 宽字节字符,就是unicode编码
	system("pause");
}

visual studio 2015默认采用GB2312编码,即:一个字节表示字母,两个字节表示汉字

加上L后,采用unicode编码,即定长码,所有字母及汉字采用两个字节编码

 

import sys
print(sys.getdefaultencoding())      # 默认是utf-8编码
with open('a.txt','w') as f:
    f.write('我是aa\n')              # 如果仅仅含有字符,使用utf-8编码
                                     # 如果既含有字符,又含有汉字,使用ANSI,表示不同的系统采用不同的编码。windows采用的是GB2312

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值