CCF201703-3 Markdown (100分)

试题编号:201703-3
试题名称:Markdown
时间限制:1.0s
内存限制:256.0MB
问题描述:

问题描述

  Markdown 是一种很流行的轻量级标记语言(lightweight markup language),广泛用于撰写带格式的文档。例如以下这段文本就是用 Markdown 的语法写成的:



  这些用 Markdown 写成的文本,尽管本身是纯文本格式,然而读者可以很容易地看出它的文档结构。同时,还有很多工具可以自动把 Markdown 文本转换成 HTML 甚至 Word、PDF 等格式,取得更好的排版效果。例如上面这段文本通过转化得到的 HTML 代码如下所示:



  本题要求由你来编写一个 Markdown 的转换工具,完成 Markdown 文本到 HTML 代码的转换工作。简化起见,本题定义的 Markdown 语法规则和转换规则描述如下:
  ●区块:区块是文档的顶级结构。本题的 Markdown 语法有 3 种区块格式。在输入中,相邻两个区块之间用一个或多个空行分隔。输出时删除所有分隔区块的空行。
  ○段落:一般情况下,连续多行输入构成一个段落。段落的转换规则是在段落的第一行行首插入 `<p>`,在最后一行行末插入 `</p>`。
  ○标题:每个标题区块只有一行,由若干个 `#` 开头,接着一个或多个空格,然后是标题内容,直到行末。`#` 的个数决定了标题的等级。转换时,`# Heading` 转换为 `<h1>Heading</h1>`,`## Heading` 转换为 `<h2>Heading</h2>`,以此类推。标题等级最深为 6。
  ○无序列表:无序列表由若干行组成,每行由 `*` 开头,接着一个或多个空格,然后是列表项目的文字,直到行末。转换时,在最开始插入一行 `<ul>`,最后插入一行 `</ul>`;对于每行,`* Item` 转换为 `<li>Item</li>`。本题中的无序列表只有一层,不会出现缩进的情况。
  ●行内:对于区块中的内容,有以下两种行内结构。
  ○强调:`_Text_` 转换为 `<em>Text</em>`。强调不会出现嵌套,每行中 `_` 的个数一定是偶数,且不会连续相邻。注意 `_Text_` 的前后不一定是空格字符。
  ○超级链接:`[Text](Link)` 转换为 `<a href="Link">Text</a>`。超级链接和强调可以相互嵌套,但每种格式不会超过一层。

输入格式

  输入由若干行组成,表示一个用本题规定的 Markdown 语法撰写的文档。

输出格式

  输出由若干行组成,表示输入的 Markdown 文档转换成产生的 HTML 代码。

样例输入

# Hello

Hello, world!

样例输出

<h1>Hello</h1>
<p>Hello, world!</p>

评测用例规模与约定

  本题的测试点满足以下条件:
  ●本题每个测试点的输入数据所包含的行数都不超过100,每行字符的个数(包括行末换行符)都不超过100。
  ●除了换行符之外,所有字符都是 ASCII 码 32 至 126 的可打印字符。
  ●每行行首和行末都不会出现空格字符。
  ●输入数据除了 Markdown 语法所需,内容中不会出现 `#`、`*`、`_`、`[`、`]`、`(`、`)`、`<`、`>`、`&` 这些字符。
  ●所有测试点均符合题目所规定的 Markdown 语法,你的程序不需要考虑语法错误的情况。
  每个测试点包含的语法规则如下表所示,其中“√”表示包含,“×”表示不包含。
测试点编号段落标题无序列表强调超级链接
1××××
2×××
3×××
4×××
5×××
6××
7××
8××
9××
10

提示

  由于本题要将输入数据当做一个文本文件来处理,要逐行读取直到文件结束,C/C++、Java 语言的用户可以参考以下代码片段来读取输入内容。


第一版(时间:2018.07.27)

问题链接:CCF201703-3 Markdown

问题分析:文本处理题,掌握字符串处理的相关函数对解决此类问题有很大的帮助

程序说明:注意C++串操作的函数以及vector的使用

提交后得100分的C++程序:

#include<iostream>
#include<string>
#include<vector>

using namespace std;

vector<string>ans;

int main()
{
	//读入Markdown文本 
	string s;
	while(getline(cin,s)){
		ans.push_back(s);
	}	
	// 1.处理 强调
	for(int i=0,cnt=0;i<ans.size();i++)
	  for(int j=0;j<ans[i].length();j++)
	  	if(ans[i][j]=='_'){
	  		cnt++;
	  		s=(cnt%2)?("<em>"):("</em>");
	  		ans[i].insert(j+1,s);
	  		ans[i].erase(j,1);
		  }
	// 2.处理 超链接
	for(int i=0;i<ans.size();i++)
	  for(int j=0;j<ans[i].length();j++){
	  	int pos1=ans[i].find("[",j);
	  	int pos2=ans[i].find("]",j+1);
	  	int pos3=ans[i].find(")",j+3);
	  	if(pos1==string::npos||pos2==string::npos||pos3==string::npos)
	  	  break;
	  	string text,link;
	  	text=ans[i].substr(pos1+1,pos2-pos1-1);
	  	link=ans[i].substr(pos2+2,pos3-pos2-2);
	  	s="<a href=\""+link+"\">"+text+"</a>";
	  	ans[i].erase(pos1,pos3-pos1+1);
	  	ans[i].insert(pos1,s);
	  }
	// 3.
	for(int i=0;i<ans.size();i++){
		if(ans[i]=="")
		  continue;
		if(ans[i][0]=='#'){ //处理标题
			int cnt=0,j;
			while(ans[i][cnt++]=='#');
			//截取标题 
			cnt--;
			for(j=1;j<ans[i].length();j++)
			  if(ans[i][j-1]==' '&&ans[i][j]!=' ')
			    break;
			ans[i]=ans[i].substr(j);
			ans[i]="<h>"+ans[i]+"</h>";
			char c=cnt+'0';
			ans[i].insert(2,1,c);
			int len=ans[i].length()-1;
			ans[i].insert(len,1,c);
		}
		else if(ans[i][0]=='*'){//处理列表 
			//列表第一行是i,找到最后一行
			int j=i+1;
			for(;j<ans.size()&&ans[j][0]=='*';j++);
			j--;//j是列表的最后一行
			ans.insert(ans.begin()+j+1,"</ul>");//考虑到插入操作对迭代器的影响故从后往前插 
			ans.insert(ans.begin()+i,"<ul>");  
			//现在列表处于 i+1 和 j+1之间了
			for(int k=i+1;k<=j+1;k++){
				int pos;
				for(pos=1;pos<ans[k].length();pos++)
				  if(ans[k][pos-1]=' '&&ans[k][pos]!=' ')
				    break;
				ans[k]=ans[k].substr(pos);
				ans[k]="<li>"+ans[k]+"</li>";
			}
			i=j+2; 
		}
		else{
			int pos=i+1;
			for(;pos<ans.size()&&ans[pos]!=""&&ans[pos][0]!='#'&&ans[pos][0]!='*';pos++);
			pos--;
			ans[i]="<p>"+ans[i];
			ans[pos]+="</p>";
			i=pos;
		}
	}
	for(int i=0;i<ans.size();i++)
	  if(ans[i]!="")
	    cout<<ans[i]<<endl;
	return 0; 
}

第二版(时间:2019.03.12) 

#include<iostream>
#include<string>
#include<vector>
#include<algorithm>

using namespace std;

//强调 
void f1(string &s)
{
	int cnt=0;
	for(int i=0;i<s.length();i++)
	{
		if(s[i]=='_')
		{
			cnt++;
			string tmp=(cnt%2)?"<em>":"</em>";
			s.replace(i,1,tmp);//将'_'替换成tmp 
		}
	}
}

//超链接
void f2(string &s)
{
	string::size_type p1=0,p2=0,q1=0,q2=0;// 分别表示[、]、(、)四种符号的位置 
	while(1)
	{
		p1=s.find('[',p1),p2=s.find(']',p1+1),q1=s.find('(',p1+2),q2=s.find(')',p1+3);
		//如果查找不到,就跳出 
		if(p1==string::npos||p2==string::npos||q1==string::npos||q2==string::npos) 
			break;
		if(p1+1<p2&&p2+1==q1&&q1+1<q2) 
		{
			string text=s.substr(p1+1,p2-p1-1);//截取text的值 
			string link=s.substr(q1+1,q2-q1-1);//截取link的值 
			s.replace(p1,q2-p1+1,"<a href=\""+link+"\">"+text+"</a>");//替换 
		}
		else 
		  break;
	}
} 

int main()
{
	string s;
	vector<string>v;
	while(getline(cin,s)) 
	{
		f1(s);//处理强调 
		f2(s);//处理超链接 
		v.push_back(s);//存放在向量v中 
	}
	//处理v中的字符串		  
	for(int i=0;i<v.size();)
	{
		if(v[i].length()==0)//情况一:空串,直接跳过 
		{
			i++;
		}
		else if(v[i][0]=='#')//情况二:标题 
		{
			int cnt=0,j=0;
			while(j<v[i].length()&&v[i][j]=='#') cnt++,j++;//统计'#'的个数 
			while(j<v[i].length()&&v[i][j]==' ') j++;
			printf("<h%d>",cnt);
			if(j<v[i].length()) cout<<v[i].substr(j);//打印标题 
			printf("</h%d>\n",cnt);
			i++;
		}
		else if(v[i][0]=='*')//情况三:列表 
		{
			string p="<ul>\n";
			while(i<v.size()&&v[i].length()>0&&v[i][0]=='*')
			{
				int j=1;
				while(j<v[i].length()&&v[i][j]==' ') j++;
				if(j<v[i].length()) p+="<li>"+v[i].substr(j)+"</li>\n";
				i++;
			}
			p+="</ul>\n";
			cout<<p;
		}
		else//情况四:段落 
		{
			string p="<p>";
			bool flag=false;
			while(i<v.size()&&v[i].length()>0&&v[i][0]!='*'&&v[i][0]!='#')
			{
				if(flag) p+='\n';
				p+=v[i];
				flag=true;
				i++;
			}
			p+="</p>\n";
			cout<<p;
		}
	}
	return 0;
}

 

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值