codeforce_exercise_r26

最新推荐文章于 2021-02-25 22:05:38 发布

saika2k

最新推荐文章于 2021-02-25 22:05:38 发布

阅读量94

点赞数

分类专栏： codeforce 文章标签： Markdown HTML 转换器字符串处理编程

本文链接：https://blog.csdn.net/qq_43715114/article/details/113825041

版权

codeforce 专栏收录该内容

38 篇文章 0 订阅

订阅专栏

Markdown（csp201703-3）：

问题描述

题目简述

本题要求由你来编写一个 Markdown 的转换工具，完成 Markdown 文本到 HTML 代码的转换工作。简化起见，本题定义的 Markdown 语法规则和转换规则描述如下：
　　●区块：区块是文档的顶级结构。本题的 Markdown 语法有 3 种区块格式。在输入中，相邻两个区块之间用一个或多个空行分隔。输出时删除所有分隔区块的空行。
　　○段落：一般情况下，连续多行输入构成一个段落。段落的转换规则是在段落的第一行行首插入 <p>，在最后一行行末插入 </p>。
　　○标题：每个标题区块只有一行，由若干个 # 开头，接着一个或多个空格，然后是标题内容，直到行末。# 的个数决定了标题的等级。转换时，# Heading 转换为 <h1>Heading</h1>，## Heading 转换为 <h2>Heading</h2>，以此类推。标题等级最深为 6。
　　○无序列表：无序列表由若干行组成，每行由 * 开头，接着一个或多个空格，然后是列表项目的文字，直到行末。转换时，在最开始插入一行 <ul>，最后插入一行 </ul>；对于每行，* Item 转换为 <li>Item</li>。本题中的无序列表只有一层，不会出现缩进的情况。
　　●行内：对于区块中的内容，有以下两种行内结构。
　　○强调：_Text_ 转换为 <em>Text</em>。强调不会出现嵌套，每行中 _ 的个数一定是偶数，且不会连续相邻。注意 _Text_ 的前后不一定是空格字符。
　　○超级链接：[Text](Link) 转换为 <a href="Link">Text</a>。超级链接和强调可以相互嵌套，但每种格式不会超过一层。

输入/输出格式

输入格式：
输入由若干行组成，表示一个用本题规定的 Markdown 语法撰写的文档。
输出格式：
输出由若干行组成，表示输入的 Markdown 文档转换成产生的 HTML 代码。

样例

输入样例：

# Hello

Hello, world!

输出样例：

<h1>Hello</h1>
<p>Hello, world!</p>

问题分析

解题思路

这个题强烈建议输出到文件进行调试，都输出到标准输出实在是太乱了。然后这个题也是一个字符串处理问题。处理这种问题实际上最主要的思路就是找到标志物之后替换。审完题后可以发现，这里需要处理的东西有5种：段落，标题，列表，强调和超链接。其中后两种是针对输入的一行文本中的部分文本，前三种的针对整行或者某几行。
因为前三种的范围较大，先处理这三种：
1.段落：标志为字符串的第一个字符为任意文本字符。由于一个段落可以覆盖多行的范围，因此在补充标签时需要特判。
2.标题：标志为字符串的第一个字符为“#”。标题只有一行，一共有六种不同的标签，因此，需要先判断有几个“#”，之后找到文本的开头，将前面的“#”和空格全部替换为标签，之后在末尾补上结束标签。
3.列表：标志为字符串的第一个字符为“*”。可能覆盖多行，和段落一样，也需要特判开始标签是否需要添加。不同的是由于列表中的项每项只有1行，因此对于每行的处理方法和标题相同。
之后是后两种：
4.强调：标志为“_”。处理方法为从前向后寻找第一个下划线，找到后从该位置找到出现的第一个下划线。这个子串即为需要强调的部分，执行替换即可。
5.超链接：标志为“[”。这个麻烦的一点是它有两个参数：文本和链接。其实思路和4是一样的，只是需要取出两个参数后，将超链接的整体替换即可。
注意由于一行中可能有多个强调部分和超链接部分，因此，需要遍历完整个字符串才可以。
最后，在读入结束时也有的时候需要补结束标签，需要特别判断。

参考代码

#include <iostream>
#include <string>

using namespace std;

string str;
int block_type;

void deal_header()
{
	int cnt=0;
	for(int i=0;i<str.length();i++)
	{
		if(str[i]=='#') cnt++;
		if(str[i]!='#'&&str[i]!=' ') 
		{
			string addstr1;
			string addstr2;
			switch (cnt)
			{
				case 1: addstr1="<h1>";addstr2="</h1>";break;
				case 2: addstr1="<h2>";addstr2="</h2>";break;
				case 3: addstr1="<h3>";addstr2="</h3>";break;
				case 4: addstr1="<h4>";addstr2="</h4>";break;
				case 5: addstr1="<h5>";addstr2="</h5>";break;
				case 6: addstr1="<h6>";addstr2="</h6>";break;
			}
			str=addstr1+str.substr(i,str.length())+addstr2;
			break; 
		}
	}	
}

void deal_para()
{
	if(block_type==1) cout<<endl;
	if(block_type==0)
	{
		cout<<"<p>";
		block_type=1;
	}
}

void deal_list()
{
	if(block_type==0)
	{
		cout<<"<ul>"<<endl;
		block_type=3;
	}
	for(int i=0;i<str.length();i++)
	{
		if(str[i]!='*'&&str[i]!=' ') 
		{
			string addstr1="<li>";
			string addstr2="</li>";
			str=addstr1+str.substr(i,str.length())+addstr2;
			break; 
		}
	}
}

void deal_emphasize()
{
	int pos=str.find("_");
	while(pos!=str.npos)
	{
		str.replace(pos,1,"<em>");
		int right_pos=str.find("_");
		str.replace(right_pos,1,"</em>");
		pos=str.find("_");
	}
}

void deal_link()
{
	int pos=str.find("[");
	while(pos!=str.npos)
	{
		int right_pos1=str.find("]");
		string text=str.substr(pos+1,right_pos1-pos-1);
		int left_pos2=right_pos1+1;
		int right_pos2=str.find(")");
		string link=str.substr(left_pos2+1,right_pos2-left_pos2-1);
		string addstr="<a href=\""+link+"\">"+text+"</a>";
		str.replace(pos,right_pos2-pos+1,addstr);
		pos=str.find("[");
	}
}

int main()
{
	block_type=0;
	while(getline(cin,str))
	{
		if(str.length()==0)
		{
			switch (block_type)
			{
				case 1:
					cout<<"</p>"<<endl;break;
				case 3:
					cout<<"</ul>"<<endl;break;
				default: break;
			}
			block_type=0;
		}
		else 
		{
			if(str[0]=='#')
			{
				deal_header();
				deal_link();
				deal_emphasize();
				cout<<str<<endl;
			}
			else if(str[0]=='*')
			{
				deal_list();
				deal_link();
				deal_emphasize();
				cout<<str<<endl;
			}
			else 
			{
				deal_para();
				deal_link();
				deal_emphasize();
				cout<<str;
			}
		}
	}
	switch (block_type)
	{
		case 1:
		    cout<<"</p>"<<endl;break;
		case 3:
			cout<<"</ul>"<<endl;break;
		default: break;
	}
	block_type=0;
	return 0;
}