文件输入输出流中的单个char型ASCII码与int的转换

当我们进行文件操作时,经常需要把文本中的文字读入以进行某些操作,其中最常见的就是读取一个字符并把它保存在一个变量中。


比特、字节与ASCII码

首先字符在c++中是怎么保存的呢?首先说一下什么是字节,一个字节有8比特,一个比特只有0和1两种取值,所以一个字节可以表示2^8=256种信息。

一般在windows中汉字占两个字节,其他字符占一个字节。象数字、英文字母、符号这些加起来总数不是很多,用一个比特显然就够了,但是汉字肯定用一个比特是不行的,所以需要两个字节。最多可以表示2^8*2^8=65536种信息,看起来应该是够用了。字节中字符对应的数字就是ASCII码了。

实际上所有数字、英文字母、符号这些加起来也没有超过128个,所以为了区分汉字与其他字符,汉字的所有ASCII码都大于128,根据这个我们就可以分辨出我们从文件中读取到底是一个字符还是一个汉字辣!


一个一个地读取文字

要想一个一个地读取文件中的文字,需要用到流对象中的get()函数,这个函数没有参数,返回读取当前字符的ASCII码,同时会让读取的位置向后走一位。如果遇到一个汉字,第一次get()函数返回汉字的第一个ASCII码,第二次返回第二个ASCII码,这两个码们都大于128。

显然我们需要用一个变量把这个get()函数返回值保存下来,我们选择unsigned char型,用char当然也可以,只是大于128的部分都变成了对应的负数。试着输出一下这个变量,会发现小于128的都会输出(有的输出是不可见的),而单个的汉字ASCII码是不显示的,当我们连续输出两个汉字的ASCII码就能看到汉字了。

如何比较?

怎么才能知道现在get()返回的是汉字还是字符呢?当然是跟128比较一下大小,直接用unsigned  char是没法比较的,可以这么写int(unsigned char型变量名)就把对应的ASCII码变成数字啦。再跟128比一下就知道是不是汉字了。如果要保存这些字符,也是保存他们的ASCII码,汉字两个,其他字符一个。
#include<fstream>
#include<iostream>
using namespace std;
ReadTxt(string address) {
	fstream infile;
	infile.open(address);//address是文件位置
	while (!infile.eof())//一直读到文件末尾
	{
		unsigned char get1,get2;
		int a;
		get1 = infile.get();
		a = int(get1);
		if ((get1) > 128)
			 get2 = infile.get();
		if ((get1) > 128)
			cout << get1 << get2 << endl;
		else
			cout << get1 << endl;
		
	}
	infile.close();
}




  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值