文本中多余字符串的批量删除和替换
最近,我用别人提供的java源代码制作了一个小程序,成功地将《大主宰》这部玄幻小说第1至第1333章的内容下载到自己的电脑并保存在路径为f:\test.txt的文件里。
但是,下载的这个txt文本从内容到形式还存在不少问题。一是在每隔几行,就出现www.lingdiankanshu.com这样的网址,二是在需要换行的前面都添加上了*****字符串,三是每一章节下面不分行,一排到底。
有没有办法将这些多余的字符串去掉,并重新进行分行呢?答案是肯定的,我相信会找到这样的办法。
第一步,打开“排版助手”/“文件”,“打开”f:\test.txt文件,点击“执行”,待排版助手自动将文本中的所有空行加以删除、重新排版后,点击“文件”/“另存为”,将文件保存为f:\testa.txt。
第二步,打开f:\testa.txt,复制其中的一个字符串“www.lingdiankanshu.com”,然后打开“编辑”/“替换”,在“替换内容”一栏输入“www.lingdiankanshu.com”,“替换为”一栏啥也不输入,然后点“全部替换”,稍停片刻,文本中的“www.lingdiankanshu.com”即被全部去除。然后,点击“文件”/“另存为”,将文件保存为f:\testb.txt。
第三步,打开f:\testb.txt,点击“编辑”/“替换”,在“替换内容”一栏输入“*****”,“替换为”一栏输入“
”,然后点“全部替换”,稍停片刻,文本中“*****”即被替换为“
”。然后,点击“文件”/“另存为”,将文件保存为f:\testc.txt。
第四步,打开EmEditor,在“文件”中“打开”f:\testc.txt,在“搜索”中打开“替换”,“替换”栏里输入“
”,“替换为”栏里输入“\n ”(n后面敲两次空格键),点“全部替换”,文本中所有有“
”的地方便都另起一行,而且行首都缩进了两个空格。然后,点击“文件”/“另存为”,将文件保存为f:\testd.txt。