第16周-任务4-文档的自动处理-CSDN博客

本文链接：https://blog.csdn.net/sxhelijian/article/details/7632304

【引子有些长】

　　NetLogo是一个用来对自然和社会现象进行仿真的可编程建模环境。NetLogo 特别适合对随时间演化的复杂系统进行建模。建模人员能够向成百上千的独立运行的“主体”(agent)发出指令，使探究微观层面上的个体行为与宏观模式之间的联系成为可能。NetLogo 有详尽的文档和教学材料。它还带着一个模型库，库中包含许多已经写好的仿真模型，可以直接使用也可修改。这些仿真模型覆盖自然和社会科学的许多领域，包括生物和医学，物理和化学，数学和计算机科学，以及经济学和社会心理学等。

　　NetLogo是我近年来科研工作常用的一个仿真平台，建议同学们不妨有时间玩一玩。本任务不是要让同学们用Netlogo编程，而是用C++编程去处理Netlogo源程序。

　　在NetLogo中，代码的注释以分号开始。例如，文件WolfSheep.nls中是一个模拟生态系统中狼、羊、草地保持生态平衡的一部分代码，其中，每一行分号之后的文字全是注释。

　　本题的要求是：编写C++程序，读WolfSheep.nls，去除其中所有的注释，并保存到文件WS_nocomment.nls中。

　　例如，WolfSheep.nls中下面的一段代码：

 ask patches [set pcolor green ]
  ; check　GRASS? switch.
  ; if it istrue, then grass grows and the sheep eat it. if it false, then the sheep don'tneed to eat
  if grass? [
    ask patches[
      setcountdown random grass-regrowth-time ; initialize grass grow clocks randomly
      set pcolorone-of [green brown]
    ]
  ]

　　经过处理后，在WS_nocomment.nls中，以分号作为分隔符的注释将全部不存在。即文档变为：

 ask patches [set pcolor green ]
   if grass? [
    ask patches[
      setcountdown random grass-regrowth-time ; initialize grass grow clocks randomly
      set pcolorone-of [green brown]
    ]
  ]

　　提示1：任务的另一种直白的解读是：读入每一行，复制每一行分号前面的部分。或者说，读入每一行，逐个复制文件中的字符，如果出现分号，分号及其后的文字将不再复制。

　　提示2：任务0中的某些程序可供参考，它们做了本题中的部分工作。

任务的最低要求：去除注释，如果注释单独占一行，保留空行；
任务的较高要求：当注释单独占一行时，去除注释后，空行将不再保留。注释单独占一行，即本行在分号之前，除了空格与Tab（即’\t’）外，不出现其他任何符号。
任务的最高要求：见拓展三，消除出现这种Bug的可能。

【参考解答1】

//符合任务的最低要求的程序：去除注释，如果注释单独占一行，保留空行；
#include <iostream>
#include <fstream>
using namespace std;
int main() 
{
	ifstream sourceFile;
	ofstream targetFile;
	char ch[100];
	int i;
	sourceFile.open("WolfSheep.nls", ios::in);
	targetFile.open("WS_nocomment.nls", ios::out);
	while (!sourceFile.eof())
	{	
		sourceFile.getline(ch,100,'\n');
		i=0;
		while(ch[i]!='\0' && ch[i]!=';')
		{
			targetFile.put(ch[i]);
			++i;
		}
		targetFile.put('\n');
	}
	sourceFile.close();
	targetFile.close();
	cout << "Finish!" << endl;
	system("pause");
	return 0;
}

【参考解答2】

//符合任务的较高要求的程序：当注释单独占一行时，去除注释后，空行将不再保留。
#include <iostream>
#include <fstream>
using namespace std;
bool isCommentLine(char[]);
int main() 
{
	ifstream sourceFile;
	ofstream targetFile;
	char ch[100];
	int i;
	sourceFile.open("WolfSheep.nls", ios::in);
	targetFile.open("WS_nocomment.nls", ios::out);
	while (!sourceFile.eof())
	{	
		sourceFile.getline(ch,100,'\n');
		if(!isCommentLine(ch))   //如果是独立的注释行，该行将不再写入目标文件
		{
			i=0;
			while(ch[i]!='\0' && ch[i]!=';')
			{
				targetFile.put(ch[i]);
				++i;
			}
			targetFile.put('\n');
		}
	}
	sourceFile.close();
	targetFile.close();
	cout << "Finish!" << endl;
	system("pause");
	return 0;
}

bool isCommentLine(char line[]) //判断是否为独立的注释行
{
	int i=0;
	bool is = false;
	char c=line[i];
	while(c!='\0' && c!=';' && (c==' ' || c=='\t'))
	{
		c=line[++i];
	}
	if (c==';') is=true;
	return is;
}

【拓展提示】

　　这部分的思路和体会可以用于一切由计算机自动处理文档的场所合。想想目前互联网的热潮，包括搜索引擎、自然语言处理，甚至语音识别等，都要涉及到对文本的处理。

　　这部分拓展利用对源代码的处理进一步做些体验，让计算机自动处理源代码也是业内的一个重要领域（想想你提交一个C++程序，编译系统能为你检查语法错误，能将C++代码转换为计算机能够识别和执行的机器代码——将来学习到《编译系统》有关的知识时，千万别说没用和枯燥）。要处理的C++源程序请自己准备。

　　拓展一（选做）：读入一个C++程序，将其单行的注释（即每一行“//”后面的内容）删除后保存；

　　拓展二（选做）：写一个程序，它能“剥”去C++源程序中的所有注释（包括//形式和/*...*/形式的）。

　　拓展三（选做）：修正上面所有程序中的一个Bug。如果字符串中包含表示注释的符号，如Netlogo程序中的字符串”this is acomment; that not”，C++程序中的字符串”words after //is comment.”，按照前面的处理会酿成大祸：将分号或//及其后面的符号全部删除后，表示字符串结束的双引号将不存在，破坏了字符串的完整性，同时程序将无法通过编译。

　　拓展四（选做）：基于上面的任一个程序，要处理的文件名和保存后的文件名由用户输入，并完成处理。

　　拓展五（选做）：基于拓展四，做一个MFC程序，在对话框中选择要处理的源文件名，并指定目标文件名后进行处理。如在图1中点击按钮“…”后，会利用图2的窗口选择文件。（提示：请自行查找资料，学习有关MFC中关于通用对话框的内容。文件对话框用的类是CFileDialog。通用对话框还包括颜色、字体、页面设置、打印等对话框）。