2016年诗词曲赋自选集整理过程
最近,抽空将我的诗词曲赋自选集(2016年)整理成了电子书。下面以此为例,谈谈我对它的整理过程。
1、诗与诗之间保留一个空行。
打开《武臣文苑诗词曲赋集(2016).txt》原稿,检查每首诗的上面,也就是诗与诗之间保留是否有一个空行,确定无误后,将检查后的文本保存为test001.txt,截图保存tianxia001.bmp。
2、清除文本中所有空格。
将文本导入《用vb6.0清除文本中所有的空格》,保证文本各行左对齐,不留空格。
3、在每首诗标题上面一行添加标识符##。
打开EmEditor,点“搜索”/“替换”,在“查找”里输入“^(七|绝|律|·|)+[\s\n]+”,在“替换为”里输入“##\0”,勾选“使用正则表达式”前面的复选框,点“全部替换”,每首诗标题上面一行已添加“##”字符。替换后的文本保存为mulu0023.txt,截图保存为mulu0023.bmp。
4、在每首诗标题上面分三行添加分隔符“*”、“(无注释)”和“*”。
打开mulu0023.txt,点“搜索”/“替换”,在“查找”里输入“##”,在“替换为”里输入“*\n(无注释)\n*”,勾选“使用正则表达式”前面的复选框,点“全部替换”,记事本提示已将“##”删除,并将“*”、“(无注释)”和“*”分三行分别添加到每首诗标题的上面。替换后的文本保存为mulu0024.txt,截图保存为mulu0024.bmp。
5、分别在每首诗标题前添加“第 首 ”带空格的两个字。
打开mulu0024.txt,点“搜索”/“替换”,在“查找”里输入“七律”,在“替换为”里输入“第 首 ”,勾选“使用正则表达式”和“匹配整个单词”前面的复选框,点“全部替换”,记事本提示已将“七律”替换为“第 首 七律”。接下来分别输入“七绝”、“五律”、“五绝”和“水龙吟”等,将其替换为“第 首 七绝”、“第 首 五律”、“第 首 五绝”和“第 首 水龙吟”等。替换后的文本保存为mulu0025.txt,截图保存为mulu0025.bmp。
6、分别在“第 首”中间的空白处按顺序输入阿拉伯数字。
打开mulu0025.txt,手工在“第 首”中间的空白处按顺序输入阿拉伯数字如1、2、3……,并且数字居中,左右各留有一个半角空格,直到最后一首。添加序数后的文本保存为mulu0026.txt,截图保存为mulu0026.bmp。
7、提取目录。
打开F:\mulu002文件夹,将mulu0026.txt复制到F:\mulu002根目录下,并重新将其命名为shenmu.txt。运行“test.bat”,java这个目录提取工具开始从shenmu.txt文本里把诗词的各个题目依次提取到cmd界面,然后通过复制粘贴,将提取的目录保存为mulu0027.txt。
8、将提取的目录制作成cnt格式的目录文件。
打开“mulu0027.txt”,删除与目录无关的行,选择“文件”中的另存为,在文件名称里输入“2016年诗词曲赋.cnt”,点保存即可。
9、开始分首阅读。
复制“2016年诗词曲赋.cnt”和“mulu0026.txt”到“D:\武臣文苑\电子书\分章阅读”文件夹,并将“mulu0026.txt”重新命名为“2016年诗词曲赋.txt”。运行电子书,打开目录,左边“目录”列表框里弹出所选2016年诗词曲赋目录,右边“内容”文本框里弹出所选2016年诗词曲赋内容。
10、检测目录和内容。
有时,左边的所选目录与右边的内容名不符实,一是需要打开目录文件重新添加或删除目录,二是需要打开文本重新添加或删除文本中的分隔符。从头到尾,只要目录、内容、(无注释)三对应,整理工作即为成功。