一、项目介绍
本教程讲解一个使用 Python 来解析纯文本生成一个 HTML 页面的小程序。
二、相关技术
Python:一种面向对象、解释型计算机程序设计语言,用它可以做 Web 开发、图形处理、文本处理和数学处理等等。
HTML:超文本标记语言,主要用来实现网页。
三、项目截图
纯文本文件:
解析后生成的 HTML 页面如下图
四、项目讲解
1. 文本块生成器
首先我们需要有一个文本块生成器把纯文本分成一个一个的文本块,以便接下来对每一个文本快进行解析,util.py 代码如下:
2. 处理程序
通过文本生成器我们得到了一个一个的文本块,然后需要有处理程序对不同的文本块加相应的 HTML 标记,handlers.py 代码如下:
3. 规则
有了处理程序和文本块生成器,接下来就需要一定的规则来判断每个文本块交给处理程序将要加什么标记,rules.py 代码如下:
4. 解析
最后我们就可以进行解析了,markup.py 代码如下:
运行程序(纯文本文件为 test.txt,生成 HTML 文件为 test.html)
五、小结
在这个小程序中,我们使用了 Python 来解析纯文本文件并生成 HTML 文件,这个只是简单实现,通过这个案例大家可以动手试试解析 Markdown 文件。