文件处理程序整理

在讨论C语言文件操作之前,先了解一下与文件相关的东西

ContractedBlock.gif ExpandedBlockStart.gif 文件操作基础
一.文本文件和二进制文件

文本文件的定义:由若干行字符构成的计算机文件,存在于计算机系统中,通常在文件最后一行放置文件结束标识。文本文件只能存储文件中的有效字符信息,不能存储图像、声音等信息。狭义上的二进制文件则指除开文本文件之外的文件,如图片、DOC文档。

事实上,无论是上面所定义的文本文件还是二进制文件,在计算机中存储都是以二进制的形式存储的,因此其本质并没有区别。所以广义上的二进制文件便指所有的文件。至于为什么在计算机内存储的都是二进制数据,而给我们所呈现的确是文字、图像等信息,这跟计算机硬件组成有关系,因为计算机里面的元件是晶体管,其只有两种稳定的状态,因此二进制的0和1能表示其状态。很多个晶体管的不同状态的组合便呈现给我们不同的信息了。下面以汉字在计算机中的表示为例。

二.汉字在计算机中的表示

用计算机去处理汉字信息,必须对汉字进行编码,变成能被计算机识别的二进制。汉字编码主要有输入码、机内码、字形码三种。分别有不同的作用。

输入码:为了能直接使用西方英文标准键盘输入汉字,必须制定相应的编码规则,如拼音码(拼音输入法)、数字码(数字输入法)等

机内码:指汉字在计算机内部的表示形式,即二进制形式,通常采用两字节来表示一个汉字,每个字节的最高位设置为1(其值为负),如汉字“我”在计算机内的表示为11001110 11010010.

字形码:存储在计算机内的汉字需要在屏幕上显示或者打印机上输出时,需要知道汉字的字形信息,而汉字的机内码并不能表示汉字的字形信息,因此需要专门的字形码 。最通用的字形信息显示采用点阵的形式,即将汉字的字形分解成若干个“点”形成的点阵。每个点有黑白两种信息,有笔画的用黑表示,反之用白表示。汉字的点阵信息量是很大的,比如16*16的点阵需要用256位表示其信息,则需要32字节的空间。

计算机中存放了所有汉字的字形码组合起来的字形库也称字模库,当汉字输出或者显示的时候由专门的字形检索程序根据这个汉字的机内码在字模库中找出与之对应的字形码,然后根据字形码输出到显示设备上。

所以我们平常所看到的文本文件或者图片等在计算机上都是以二进制形式存储,只是在显示的时候以人所能够识别的方式呈现给我们。

测试程序

#include<stdio.h>
#include<string.h>

int main(void)
{
char s[]="";
unsigned char *p=(unsigned char *)s;
printf("%d\n",strlen(s));
printf("%X\n",*p);
printf("%X\n",*(p+1));
return 0;
}

输出结果:

2
CE
D2
Press any key to continue

原文:http://www.cnblogs.com/dolphin0520/archive/2011/10/05/2199396.html

2011-10-06

ContractedBlock.gif ExpandedBlockStart.gif FILE* fopen(const char *path,const char *mode)
       C语言中对文件进行操作必须首先打开文件,打开文件主要涉及到fopen函数。fopen函数的原型为

FILE* fopen(const char *path,const char *mode)

其中path为文件路径,mode为打开方式

1)对于文件路径,只需注意若未明确给出绝对路径,则默认该文件在工程的目录下。若需给出绝对路径,则注意转义字符'\',比如有文件test.txt存放在C盘根目录下,则文件路径参数值应为C:\\test.txt。

2)对于mode,主要由r,w,a,+,b,t六个字符组合而成。

r:只读方式,文件必须存在

w:只写方式,若文件存在,则原有内容会被清除;若文件不存在,则会建立文件

a:追加方式打开只写文件,只允许进行写操作,若文件存在,则添加的内容放在文件末尾;若不存在,则建立文件

+:可读可写

b:以二进制方式打开文件

t:以文本方式打开文件(默认方式下以文本方式打开文件)

下面是常见的组合:

r: 以只读的方式打开文件,只允许读,此文件必须存在,否则返回NULL,打开成功返回的指针指向文件头部

r+: 以可读可写的方式打开文件,允许读写,此文件必须存在,否则返回NULL,打开成功返回的指针指向文件头部

rb+: 以可读可写、二进制方式打开文件,允许读写,此文件必须存在,否则返回NULL,打开成功返回的指针指向文件头部

rt+: 以可读可写、二进制方式打开文件,允许读写,此文件必须存在,否则返回NULL,打开成功返回的指针指向文件头部

w: 以只写的方式打开文件,只允许写,若文件存在,文件中原有内容会被清除;若文件不存在,则创建文件,打开成功返回的指针 指向文件头部

w+: 以读写的方式打开文件,允许读写,若文件存在,文件中原有内容会被清除;若文件不存在,则创建文件,打开成功返回的指针 指向文件头部

a: 以追加、只写的方式打开文件,只允许写。若文件存在,则追加的内容添加在文件末尾,若文件不存在,则创建文件。打开成功返回的指针指向文件头部(注意很多书上或资料上讲述追加方式打开成功后指针指向文件末尾是错误的)

a+: 以追加、可读写的方式打开文件,允许读写。若进行读操作,则从头开始读;若进行写操作,则将内容添加在末尾。若文件不存在,则创建文件。打开成功返回的指针指向文件头部

其他方式类似。

下面讨论一下以二进制方式和文本方式打开文件有什么区别。

其实这两种方式打开文件并没有太大的区别,仅仅只有一点区别就是在处理某些特殊字符的时候。

以文本方式打开文件,若将数据写入文件,如果遇到换行符'\n'(ASII 值为10,0A),则会转换为回车—换行'\r\n'(ASII值为13,10,0D0A)存入到文件中,同样读取的时候,若遇到回车—换行,即连续的 ASII值13,10,则自动转换为换行符。

而以二进制方式打开文件时,不会进行这样的处理。以上所述只在windows下存在,在unix下没有区别。



1.测试程序—检测以追加的方式打开文件时,指针的初始位置

假设工程目录下已存在文件test.txt,文件中含有的字符串为"ABC"

/*测试fopen函数以追加方式打开文件时初始指针的位置 2011.10.5*/

#include<stdio.h>
#include<stdlib.h>

int main(void)
{
int n;
FILE *fp;
if((fp=fopen("test.txt","a"))==NULL)
{
printf("can not open file\n");
exit(0);
}
n=ftell(fp); //得到此时fp所处位置距文件首的偏移字节数
printf("%d\n",n);
fputs("test",fp);
n=ftell(fp);
printf("%d\n",n);
fclose(fp);
return 0;
}

输出结果为:

0
7
Press any key to continue
由输出结果可知,初始打开文件后,指针是位于文件首部,只是在往文件中添加内容时,才将文件指针移动到文件末尾。

2.测试程序—检测以二进制方式和文本方式打开文件的区别

/*测试以二进制方式和文本方式打开文件的区别 2011.10.5*/

#include<stdio.h>
#include<stdlib.h>

int main(void)
{
char ch;
int i;
char s[]={'A','B','\n','C'};
FILE *fp1,*fp2;
if((fp1=fopen("test1.txt","wt"))==NULL)
{
printf("can not open file\n");
exit(0);
}
if((fp2=fopen("test2.txt","wb"))==NULL)
{
printf("can not open file\n");
exit(0);
}
for(i=0;i<4;i++)
{
fputc(s[i],fp1); //以文本方式向文件中写入数据
fputc(s[i],fp2); //以二进制方式向文件中写入数据
}
fclose(fp1);
fclose(fp2);
if((fp1=fopen("test1.txt","rt"))==NULL)
{
printf("can not open file\n");
exit(0);
}
if((fp2=fopen("test1.txt","rb"))==NULL)
{
printf("can not open file\n");
exit(0);
}
ch=fgetc(fp1);
while(!feof(fp1)) //以文本方式从文件中读取数据
{
printf("%02X",ch);
ch=fgetc(fp1);
}
printf("\n");
ch=fgetc(fp2);
while(!feof(fp2)) //以二进制方式从文件中读取数据
{
printf("%02X",ch);
ch=fgetc(fp2);
}
printf("\n");
fclose(fp1);
fclose(fp2);
return 0;
}

在向文件中写完数据后,用UltraEdit以二进制方式打开test1.txt和test2.txt,看到的结果如下:
41420A43
41420D0A43
根据得到的结果可知,以文本方式写入时,多写入了一个字符0D,即'\r'

程序输出结果:

41420A43
41420D0A43
请按任意键继续. . .

分别以文本方式和二进制方式读取test1.txt时,输出的内容不同。

可知在以文本方式读取时,对'\r\n'进行了转换,而二进制方式读取时却没有进行这样的转换。

原文:http://www.cnblogs.com/dolphin0520/archive/2011/10/05/2199598.html

2011-10-06

ContractedBlock.gif ExpandedBlockStart.gif 将文件中所有小写字母改为大写
#include <stdio.h>

int main()
{
FILE *file;
int ch;

file=fopen("a","r+");
if(file==NULL)
{
printf("Open file error\n");
return 1;
}

while(!feof(file))
{
ch=getc(file);
if(ch>'a' && ch<'z')
{
ch=ch-32;
fseek(file,-1,SEEK_CUR);
fputc(ch,file);
fseek(file,0,SEEK_CUR);
}
}
return 0;
}

2011-09-30

待续。。。

转载于:https://www.cnblogs.com/gala/archive/2011/09/30/2196491.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值