@1.问题描述:
C和C++的初学者经常采用一行一行读入文件的办法对文件数据进行处理。但是经常会有一些情况需要将一个文件整体一次读入内存处理。而C和C++库中并没有提供直接一次读入文件全部数据的函数。
@2.解决方法:
目前给出C和C++的解决方案,下面两个程序只是用于演示,不过这些代码已经很容易改写成想要的函数了。
解决这个问题的思路是:
1.由于要将文件完整读入,所以必须使用二进制方式打开(若文本方式打开,文件流中会把一些非字符的数据过滤掉,我们将读取不到那些内容)。
2.打开文件后,我们首先获取文件的大小,然后在内存中分配足够的空间,再把文件拷贝到内存空间中。之后使用内存空间进行数据处理,演示程序中没有真正的处理,我们只是简单将其输出。
@3.代码:
C实现
[cpp] view plaincopy
1. #include <stdio.h>
2. #include <stdlib.h>
3.
4. int main ()
5. {
6. FILE * pFile;
7. long lSize;
8. char * buffer;
9. size_t result;
10.
11. /* 若要一个byte不漏地读入整个文件,只能采用二进制方式打开 */
12. pFile = fopen ("test.txt", "rb" );
13. if (pFile==NULL)
14. {
15. fputs ("File error",stderr);
16. exit (1);
17. }
18.
19. /* 获取文件大小 */
20. fseek (pFile , 0 , SEEK_END);
21. lSize = ftell (pFile);
22. rewind (pFile);
23.
24. /* 分配内存存储整个文件 */
25. buffer = (char*) malloc (sizeof(char)*lSize);
26. if (buffer == NULL)
27. {
28. fputs ("Memory error",stderr);
29. exit (2);
30. }
31.
32. /* 将文件拷贝到buffer中 */
33. result = fread (buffer,1,lSize,pFile);
34. if (result != lSize)
35. {
36. fputs ("Reading error",stderr);
37. exit (3);
38. }
39. /* 现在整个文件已经在buffer中,可由标准输出打印内容 */
40. printf("%s", buffer);
41.
42. /* 结束演示,关闭文件并释放内存 */
43. fclose (pFile);
44. free (buffer);
45. return 0;
46. }
C++实现
[cpp] view plaincopy
1. #include <iostream>
2. #include <fstream>
3. using namespace std;
4.
5. int main () {
6. filebuf *pbuf;
7. ifstream filestr;
8. long size;
9. char * buffer;
10. // 要读入整个文件,必须采用二进制打开
11. filestr.open ("test.txt", ios::binary);
12. // 获取filestr对应buffer对象的指针
13. pbuf=filestr.rdbuf();
14.
15. // 调用buffer对象方法获取文件大小
16. size=pbuf->pubseekoff (0,ios::end,ios::in);
17. pbuf->pubseekpos (0,ios::in);
18.
19. // 分配内存空间
20. buffer=new char[size];
21.
22. // 获取文件内容
23. pbuf->sgetn (buffer,size);
24.
25. filestr.close();
26. // 输出到标准输出
27. cout.write (buffer,size);
28.
29. delete []buffer;
30. return 0;
31. }
@4.注意的问题:
在这个演示程序中,如果采用文本方式打开会如何呢?即把C实现中的文件打开改为pFile =fopen ("test.txt","r" ),C++中的文件打开改为filestr.open("test.txt")
虽然这个用于测试的文件本身是一个文本文件,文本内容为:
test.txt
[plain] view plaincopy
1. abcdefghijklm
2.
3. abcdefghijklm
4.
5. ppdsbd
但是如果采用文本模式打开仍会出现问题,测试中的“C实现”代码的程序会输出:
[cpp] view plaincopy
1. Reading error
原因是有一些字符被文件流处理掉了,这造成fread函数讲到的字符数少于文件大小lSize,返回值result不等于lSize于是程序输出Readingerror后退出了。
同样的情况在C++实现的代码中也有,但是C++程序并没有退出,但它的输出结果不对,内容如下(仅为本机测试结果,因时因机器而异)
[plain] view plaincopy
1. abcdefghijklm
2.
3. abcdefghijklm
4.
5. ppdsbdes\M
很明显末尾多出了"es\M"四个无效字符,很明显文件的末尾的字符串终止符('\0')被处理掉了,它并没有被写入buffer中,以致输出时多输出了四个无效字符。
学习笔记:streambuf
顺序访问流中的字符。如果用一个数组模拟出流,代码将是下面样子的。
char sgetc() { returnbuff[i]; }
char sbumpc(){ returnbuff[i++]; } 先取当前字符,然后指针移向后一个
char snextc(){ return buff[++i]; } 先移动指针,然后取值
逐个字符的打印出abcdefg
stringstream ss;
ss << "abcdefg";
streambuf *pbuf = ss.rdbuf();
do
{
char ch = pbuf->sgetc() ;
cout << ch;
}while(pbuf->snextc()!=EOF);
验证缓冲区在起作用,pbuf->in_avail()返回的值在变化
fstream fs;
fs.open("C:\\test.log");
streambuf *pbuf= fs.rdbuf();
while(pbuf->sgetc()!=EOF)
{
char ch = pbuf->sbumpc() ; //弹出一个字符
cout << ch;
streamsize size=pbuf->in_avail(); //查询缓冲区内有效数据个数(把缓存区看做一个容器)
}
实现文件大小的查询,(C函数fseek,ftell)
fstream filestr ("C:\\test.log");
streambuf * pbuf = filestr.rdbuf();
size = pbuf->pubseekoff(0,ios_base::end);
设置程序员选择的任意缓冲区(C函数setvbuf)
fstream ss ("C:\\test.log");
streambuf *pbuf = ss.rdbuf();
char mybuffer [2048]={0};
pbuf->pubsetbuf(mybuffer,2048);
读取出来的一个字符,可以做退回操作
ch=pbuf->sbumpc();
int r = pbuf->sputbackc (ch);
ch = pbuf->sgetc();