Markdown(csp201703-3) :
问题描述
题目简述
本题要求由你来编写一个 Markdown 的转换工具,完成 Markdown 文本到 HTML 代码的转换工作。简化起见,本题定义的 Markdown 语法规则和转换规则描述如下:
●区块:区块是文档的顶级结构。本题的 Markdown 语法有 3 种区块格式。在输入中,相邻两个区块之间用一个或多个空行分隔。输出时删除所有分隔区块的空行。
○段落:一般情况下,连续多行输入构成一个段落。段落的转换规则是在段落的第一行行首插入 <p>
,在最后一行行末插入 </p>
。
○标题:每个标题区块只有一行,由若干个 #
开头,接着一个或多个空格,然后是标题内容,直到行末。#
的个数决定了标题的等级。转换时,# Heading
转换为 <h1>Heading</h1>
,## Heading
转换为 <h2>Heading</h2>
,以此类推。标题等级最深为 6。
○无序列表:无序列表由若干行组成,每行由 *
开头,接着一个或多个空格,然后是列表项目的文字,直到行末。转换时,在最开始插入一行 <ul>
,最后插入一行 </ul>
;对于每行,* Item
转换为 <li>Item</li>
。本题中的无序列表只有一层,不会出现缩进的情况。
●行内:对于区块中的内容,有以下两种行内结构。
○强调:_Text_
转换为 <em>Text</em>
。强调不会出现嵌套,每行中 _
的个数一定是偶数,且不会连续相邻。注意 _Text_
的前后不一定是空格字符。
○超级链接:[Text](Link)
转换为 <a href="Link">Text</a>
。超级链接和强调可以相互嵌套,但每种格式不会超过一层。
输入/输出格式
输入格式:
输入由若干行组成,表示一个用本题规定的 Markdown 语法撰写的文档。
输出格式:
输出由若干行组成,表示输入的 Markdown 文档转换成产生的 HTML 代码。
样例
输入样例:
# Hello
Hello, world!
输出样例:
<h1>Hello</h1>
<p>Hello, world!</p>
问题分析
解题思路
这个题强烈建议输出到文件进行调试,都输出到标准输出实在是太乱了。然后这个题也是一个字符串处理问题。处理这种问题实际上最主要的思路就是找到标志物之后替换。审完题后可以发现,这里需要处理的东西有5种:段落,标题,列表,强调和超链接。其中后两种是针对输入的一行文本中的部分文本,前三种的针对整行或者某几行。
因为前三种的范围较大,先处理这三种:
1.段落:标志为字符串的第一个字符为任意文本字符。由于一个段落可以覆盖多行的范围,因此在补充标签时需要特判。
2.标题:标志为字符串的第一个字符为“#”。标题只有一行,一共有六种不同的标签,因此,需要先判断有几个“#”,之后找到文本的开头,将前面的“#”和空格全部替换为标签,之后在末尾补上结束标签。
3.列表:标志为字符串的第一个字符为“*”。可能覆盖多行,和段落一样,也需要特判开始标签是否需要添加。不同的是由于列表中的项每项只有1行,因此对于每行的处理方法和标题相同。
之后是后两种:
4.强调:标志为“_”。处理方法为从前向后寻找第一个下划线,找到后从该位置找到出现的第一个下划线。这个子串即为需要强调的部分,执行替换即可。
5.超链接:标志为“[”。这个麻烦的一点是它有两个参数:文本和链接。其实思路和4是一样的,只是需要取出两个参数后,将超链接的整体替换即可。
注意由于一行中可能有多个强调部分和超链接部分,因此,需要遍历完整个字符串才可以。
最后,在读入结束时也有的时候需要补结束标签,需要特别判断。
参考代码
#include <iostream>
#include <string>
using namespace std;
string str;
int block_type;
void deal_header()
{
int cnt=0;
for(int i=0;i<str.length();i++)
{
if(str[i]=='#') cnt++;
if(str[i]!='#'&&str[i]!=' ')
{
string addstr1;
string addstr2;
switch (cnt)
{
case 1: addstr1="<h1>";addstr2="</h1>";break;
case 2: addstr1="<h2>";addstr2="</h2>";break;
case 3: addstr1="<h3>";addstr2="</h3>";break;
case 4: addstr1="<h4>";addstr2="</h4>";break;
case 5: addstr1="<h5>";addstr2="</h5>";break;
case 6: addstr1="<h6>";addstr2="</h6>";break;
}
str=addstr1+str.substr(i,str.length())+addstr2;
break;
}
}
}
void deal_para()
{
if(block_type==1) cout<<endl;
if(block_type==0)
{
cout<<"<p>";
block_type=1;
}
}
void deal_list()
{
if(block_type==0)
{
cout<<"<ul>"<<endl;
block_type=3;
}
for(int i=0;i<str.length();i++)
{
if(str[i]!='*'&&str[i]!=' ')
{
string addstr1="<li>";
string addstr2="</li>";
str=addstr1+str.substr(i,str.length())+addstr2;
break;
}
}
}
void deal_emphasize()
{
int pos=str.find("_");
while(pos!=str.npos)
{
str.replace(pos,1,"<em>");
int right_pos=str.find("_");
str.replace(right_pos,1,"</em>");
pos=str.find("_");
}
}
void deal_link()
{
int pos=str.find("[");
while(pos!=str.npos)
{
int right_pos1=str.find("]");
string text=str.substr(pos+1,right_pos1-pos-1);
int left_pos2=right_pos1+1;
int right_pos2=str.find(")");
string link=str.substr(left_pos2+1,right_pos2-left_pos2-1);
string addstr="<a href=\""+link+"\">"+text+"</a>";
str.replace(pos,right_pos2-pos+1,addstr);
pos=str.find("[");
}
}
int main()
{
block_type=0;
while(getline(cin,str))
{
if(str.length()==0)
{
switch (block_type)
{
case 1:
cout<<"</p>"<<endl;break;
case 3:
cout<<"</ul>"<<endl;break;
default: break;
}
block_type=0;
}
else
{
if(str[0]=='#')
{
deal_header();
deal_link();
deal_emphasize();
cout<<str<<endl;
}
else if(str[0]=='*')
{
deal_list();
deal_link();
deal_emphasize();
cout<<str<<endl;
}
else
{
deal_para();
deal_link();
deal_emphasize();
cout<<str;
}
}
}
switch (block_type)
{
case 1:
cout<<"</p>"<<endl;break;
case 3:
cout<<"</ul>"<<endl;break;
default: break;
}
block_type=0;
return 0;
}
心得体会
看着题目很长,实际上好像并不算很难,思路上也很清晰,程序也比较好写。就是调试的时候都输出到标准输出真的阴间。。。总之感觉还是不错的。