第16周-任务4-文档的自动处理

【引子有些长】

  NetLogo是一个用来对自然和社会现象进行仿真的可编程建模环境。NetLogo 特别适合对随时间演化的复杂系统进行建模。建模人员能够向成百上千的独立运行的“主体”(agent)发出指令,使探究微观层面上的个体行为与宏观模式之间的联系成为可能。NetLogo 有详尽的文档和教学材料。它还带着一个模型库,库中包含许多已经写好的仿真模型,可以直接使用也可修改。这些仿真模型覆盖自然和社会科学的许多领域,包括生物和医学,物理和化学,数学和计算机科学,以及经济学和社会心理学等。

  NetLogo是我近年来科研工作常用的一个仿真平台,建议同学们不妨有时间玩一玩。本任务不是要让同学们用Netlogo编程,而是用C++编程去处理Netlogo源程序。

  在NetLogo中,代码的注释以分号开始。例如,文件WolfSheep.nls中是一个模拟生态系统中狼、羊、草地保持生态平衡的一部分代码,其中,每一行分号之后的文字全是注释。

  本题的要求是:编写C++程序,读WolfSheep.nls,去除其中所有的注释,并保存到文件WS_nocomment.nls中。

  例如,WolfSheep.nls中下面的一段代码:

 

 ask patches [set pcolor green ]
  ; check GRASS? switch.
  ; if it istrue, then grass grows and the sheep eat it. if it false, then the sheep don'tneed to eat
  if grass? [
    ask patches[
      setcountdown random grass-regrowth-time ; initialize grass grow clocks randomly
      set pcolorone-of [green brown]
    ]
  ]

  经过处理后,在WS_nocomment.nls中,以分号作为分隔符的注释将全部不存在。即文档变为:

 ask patches [set pcolor green ]
   if grass? [
    ask patches[
      setcountdown random grass-regrowth-time ; initialize grass grow clocks randomly
      set pcolorone-of [green brown]
    ]
  ]

  提示1:任务的另一种直白的解读是:读入每一行,复制每一行分号前面的部分。或者说,读入每一行,逐个复制文件中的字符,如果出现分号,分号及其后的文字将不再复制。

  提示2:任务0中的某些程序可供参考,它们做了本题中的部分工作。

  • 任务的最低要求:去除注释,如果注释单独占一行,保留空行;
  • 任务的较高要求:当注释单独占一行时,去除注释后,空行将不再保留。注释单独占一行,即本行在分号之前,除了空格与Tab(即’\t’)外,不出现其他任何符号。
  • 任务的最高要求:见拓展三,消除出现这种Bug的可能。

【参考解答1】

//符合任务的最低要求的程序:去除注释,如果注释单独占一行,保留空行;
#include <iostream>
#include <fstream>
using namespace std;
int main() 
{
	ifstream sourceFile;
	ofstream targetFile;
	char ch[100];
	int i;
	sourceFile.open("WolfSheep.nls", ios::in);
	targetFile.open("WS_nocomment.nls", ios::out);
	while (!sourceFile.eof())
	{	
		sourceFile.getline(ch,100,'\n');
		i=0;
		while(ch[i]!='\0' && ch[i]!=';')
		{
			targetFile.put(ch[i]);
			++i;
		}
		targetFile.put('\n');
	}
	sourceFile.close();
	targetFile.close();
	cout << "Finish!" << endl;
	system("pause");
	return 0;
}

【参考解答2】

//符合任务的较高要求的程序:当注释单独占一行时,去除注释后,空行将不再保留。
#include <iostream>
#include <fstream>
using namespace std;
bool isCommentLine(char[]);
int main() 
{
	ifstream sourceFile;
	ofstream targetFile;
	char ch[100];
	int i;
	sourceFile.open("WolfSheep.nls", ios::in);
	targetFile.open("WS_nocomment.nls", ios::out);
	while (!sourceFile.eof())
	{	
		sourceFile.getline(ch,100,'\n');
		if(!isCommentLine(ch))   //如果是独立的注释行,该行将不再写入目标文件
		{
			i=0;
			while(ch[i]!='\0' && ch[i]!=';')
			{
				targetFile.put(ch[i]);
				++i;
			}
			targetFile.put('\n');
		}
	}
	sourceFile.close();
	targetFile.close();
	cout << "Finish!" << endl;
	system("pause");
	return 0;
}

bool isCommentLine(char line[]) //判断是否为独立的注释行
{
	int i=0;
	bool is = false;
	char c=line[i];
	while(c!='\0' && c!=';' && (c==' ' || c=='\t'))
	{
		c=line[++i];
	}
	if (c==';') is=true;
	return is;
}

【拓展提示】

  这部分的思路和体会可以用于一切由计算机自动处理文档的场所合。想想目前互联网的热潮,包括搜索引擎、自然语言处理,甚至语音识别等,都要涉及到对文本的处理。

  这部分拓展利用对源代码的处理进一步做些体验,让计算机自动处理源代码也是业内的一个重要领域(想想你提交一个C++程序,编译系统能为你检查语法错误,能将C++代码转换为计算机能够识别和执行的机器代码——将来学习到《编译系统》有关的知识时,千万别说没用和枯燥)。要处理的C++源程序请自己准备。

  拓展一(选做):读入一个C++程序,将其单行的注释(即 每一行“//”后面的内容)删除后保存;

  拓展二(选做):写一个程序,它能“剥”去C++源程序中的所有注释(包括//形式和/*...*/形式的)。

  拓展三(选做):修正上面所有程序中的一个Bug。如果字符串中包含表示注释的符号,如Netlogo程序中的字符串”this is acomment; that not”,C++程序中的字符串”words after //is comment.”,按照前面的处理会酿成大祸:将分号或//及其后面的符号全部删除后,表示字符串结束的双引号将不存在,破坏了字符串的完整性,同时程序将无法通过编译。

  拓展四(选做):基于上面的任一个程序,要处理的文件名和保存后的文件名由用户输入,并完成处理。

  拓展五(选做):基于拓展四,做一个MFC程序,在对话框中选择要处理的源文件名,并指定目标文件名后进行处理。如在图1中点击按钮“…”后,会利用图2的窗口选择文件。(提示:请自行查找资料,学习有关MFC中关于通用对话框的内容。文件对话框用的类是CFileDialog。通用对话框还包括颜色、字体、页面设置、打印等对话框)。


图1


图2

  拓展六(选做):跳出杀戮源代码中注释的行为,为程序的每一行后面都加上“//”,以方便程序员精心注释(练练而已,要每行代码后都写注释,勤奋过头了)。

  拓展七(选做):简单处理一般的文本。某些作者在写作中,无意中会在行首加入个数不定的各种非法符号,如多个空格、Tab符号、#、$等等。现在规定每一行必须以字母开头,请编程序让计算机自动整理这些不规矩的文本。提示:你要先做这么一个不规矩的文本。更高要求:规矩的文本每行前要有两个空格。



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
如果您想要实现自动复制网页上的指定名字,然后将其填写到指定的表格中,您可以使用一些自动化工具或脚本来实现。 其中,Python 是一种广泛使用的编程语言,也有许多适用于自动任务的 Python 库可供使用。您可以使用 requests 库来获取网页内容,使用 BeautifulSoup 库来解析 HTML 文档,使用 pyautogui 库来模拟鼠标和键盘操作,以及使用 pandas 库来处理表格数据。 以下是一个简单的示例代码,可以帮助您开始实现自动填写表格的任务: ```python import requests from bs4 import BeautifulSoup import pyautogui import pandas as pd # 获取网页内容 url = 'https://www.example.com' response = requests.get(url) html = response.text # 解析 HTML 文档 soup = BeautifulSoup(html, 'html.parser') name = soup.find('div', {'class': 'name'}).text # 填写表格 df = pd.read_excel('example.xlsx') row = df.loc[df['name'] == name].iloc[0] pyautogui.click(x=100, y=200) # 点击表格第一行 pyautogui.typewrite(row['column1']) # 填写第一列数据 pyautogui.press('\t') # 切换到下一列 pyautogui.typewrite(row['column2']) # 填写第二列数据 pyautogui.press('\t') # 切换到下一列 pyautogui.typewrite(row['column3']) # 填写第三列数据 pyautogui.press('\t') # 切换到下一列 pyautogui.typewrite(row['column4']) # 填写第四列数据 pyautogui.press('\t') # 切换到下一列 pyautogui.typewrite(row['column5']) # 填写第五列数据 pyautogui.press('\t') # 切换到下一列 pyautogui.typewrite(row['column6']) # 填写第六列数据 pyautogui.press('\t') # 切换到下一列 pyautogui.typewrite(row['column7']) # 填写第七列数据 pyautogui.press('\t') # 切换到下一列 pyautogui.typewrite(row['column8']) # 填写第八列数据 pyautogui.press('\t') # 切换到下一列 pyautogui.typewrite(row['column9']) # 填写第九列数据 pyautogui.press('\t') # 切换到下一列 pyautogui.typewrite(row['column10']) # 填写第十列数据 ``` 请注意,这只是一个简单的示例代码,您需要根据具体的网页和表格结构来进行适当的修改和调整。同时,自动化操作也需要谨慎使用,以免造成不必要的误操作和风险。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

迂者-贺利坚

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值