题目内容
Markdown 是一种很流行的轻量级标记语言(lightweight markup language),广泛用于撰写带格式的文档。例如以下这段文本就是用 Markdown 的语法写成的:
这些用 Markdown 写成的文本,尽管本身是纯文本格式,然而读者可以很容易地看出它的文档结构。同时,还有很多工具可以自动把 Markdown 文本转换成 HTML 甚至 Word、PDF 等格式,取得更好的排版效果。例如上面这段文本通过转化得到的 HTML 代码如下所示:
本题要求由你来编写一个 Markdown 的转换工具,完成 Markdown 文本到 HTML 代码的转换工作。简化起见,本题定义的 Markdown 语法规则和转换规则描述如下:
●区块:区块是文档的顶级结构。本题的 Markdown 语法有 3 种区块格式。在输入中,相邻两个区块之间用一个或多个空行分隔。输出时删除所有分隔区块的空行。
○段落:一般情况下,连续多行输入构成一个段落。段落的转换规则是在段落的第一行行首插入 <p>
,在最后一行行末插入 </p>
。
○标题:每个标题区块只有一行,由若干个 #
开头,接着一个或多个空格,然后是标题内容,直到行末。#
的个数决定了标题的等级。转换时,# Heading
转换为 <h1>Heading</h1>
,## Heading
转换为 <h2>Heading</h2>
,以此类推。标题等级最深为 6。
○无序列表:无序列表由若干行组成,每行由 *
开头,接着一个或多个空格,然后是列表项目的文字,直到行末。转换时,在最开始插入一行 <ul>
,最后插入一行 </ul>
;对于每行,* Item
转换为 <li>Item</li>
。本题中的无序列表只有一层,不会出现缩进的情况。
●行内:对于区块中的内容,有以下两种行内结构。
○强调:_Text_
转换为 <em>Text</em>
。强调不会出现嵌套,每行中 _
的个数一定是偶数,且不会连续相邻。注意 _Text_
的前后不一定是空格字符。
○超级链接:[Text](Link)
转换为 <a href="Link">Text</a>
。超级链接和强调可以相互嵌套,但每种格式不会超过一层。
评测用例规模与约定
本题的测试点满足以下条件:
●本题每个测试点的输入数据所包含的行数都不超过100,每行字符的个数(包括行末换行符)都不超过100。
●除了换行符之外,所有字符都是 ASCII 码 32 至 126 的可打印字符。
●每行行首和行末都不会出现空格字符。
●输入数据除了 Markdown 语法所需,内容中不会出现 #
、*
、_
、[
、]
、(
、)
、<
、>
、&
这些字符。
●所有测试点均符合题目所规定的 Markdown 语法,你的程序不需要考虑语法错误的情况。
每个测试点包含的语法规则如下表所示,其中“√”表示包含,“×”表示不包含。
解题心得
今天真的是从早刷到晚,这个点(23:25)才AC掉。前面做不出来时很想上网看看别人的代码,但是想到这不是一个好习惯,所以克制住了,然后想起之前做过的字符串处理题目,大多都不需要很高深的算法,理清题意,注意细节就可以AC的了,于是反复尝试,也终于不负有心人,过了。
代码思路
这道题我采用模块化思想,因为题目很明确的说只有三种模式的区块,然后每种区块可能有多行,每行内部会出现两种模式,以及两种模式的嵌套模式,所以对点编写好各个函数,然后组合好就AC了。
代码如下(提交时要选devC++11环境)
#include <iostream>
#include <cctype>
using namespace std;
void deal_em(string &s)//处理强调_Text_
{
if(s.find('_') != string::npos)
{
s.replace(s.find('_'), 1, "<em>");
s.replace(s.find('_'), 1, "</em>");
}
}
void deal_superlink(string &s)//处理超链接[Text](link)
{
if(s.find('[') != string::npos)
{
string text = s.substr(s.find('[') + 1, s.find(']') - s.find('[') - 1);
string link = s.substr(s.find('(') + 1, s.find(')') - s.find('(') - 1);
string k = "<a href=\"" + link + "\">" + text + "</a>";
s.replace(s.find('['), s.find(')') - s.find('[') + 1, k);
}
}
void deal_inter(string &s)//处理超链接和强调嵌套
{
deal_em(s), deal_superlink(s), deal_em(s), deal_superlink(s);
}
void deal_heading(string &s)//处理标题heading
{
if(s[0] == '#')
{
int index = 0;
while(index < 6 && s[index] == '#') ++index;
int space_index = index;
while(isspace(s[space_index])) ++space_index;
char left[5], right[6];
left[0] = '<', left[1] = 'h', left[2] = (char)(index + '0');
left[3] = '>', left[4] = '\0';
right[0] = '<', right[1] = '/', right[2] = 'h';
right[3] = (char)(index + '0'), right[4] = '>', right[5] = '\0';
s.replace(0, space_index, left);
s.append(right);
deal_inter(s);
}
}
void deal_unorderlist(string &s)//处理无序列表
{
int space_index = (int)s.find(' ');
while(isspace(s[space_index])) ++space_index;
s.replace(0, space_index, "<li>");
s.append("</li>");
deal_inter(s);
}
void deal_pa(string &s)//处理段落
{
if(!s.empty())
{
s.pop_back();
deal_inter(s);
cout << "<p>" << s << "</p>" << endl;
s.clear();
}
}
int main()
{
//freopen("i.txt", "r", stdin);
string s1, s2, s3;
while(getline(cin, s1))
{
if(s1.empty())
{
deal_pa(s3);
}
else if(s1[0] == '*')
{
s2 = "<ul>\n";
deal_unorderlist(s1);
s2 += s1 + '\n';
while(getline(cin, s1))
{
if(s1[0] != '*') break;
deal_unorderlist(s1);
s2 += s1 + '\n';
}
s2 += "</ul>";
cout << s2 << endl;
}
else if(s1[0] == '#')
{
deal_heading(s1);
cout << s1 << endl;
}
else s3 += s1 + '\n';
}
deal_pa(s3);
return 0;
}