由于工作需要,需要截取一个html文件中的一些段,导入到数据库中(当然用诸如UE、Notepad++之类的文本编辑软件可以很简单的实现)。但是,思考了一下能否使用命令去实现呢?

    以下是一个模板文件:

当然,一个html文件中不可能只有这几个段,我们可以使用‘grep -e 字符串1 -e 字符串2’这样的命令去筛选就好了。

[root@centos1 myScript]# cat test.log 
<sffid>1234</sffid>
<policyno>PDAA1234</policyno>
<sffid>5678</sffid>
<policyno>PDAA5678</policyno>
<sffid>7890</sffid>
<policyno>PDAA7890</policyno>

    可以通过以下命令来处理:

[root@centos1 myScript]# cat test.log |sed 's/<sffid>//g' |sed 's/<policyno>//g' |sed 's/<\/sffid>//g' |sed 's/<\/policyno>//g' |sed 'N;s/\n/|/g'
1234|PDAA1234
5678|PDAA5678
7890|PDAA7890

    如果有更好的方法,望大家指导!


本人只是个小菜鸟,希望每天可以学习一点东西,有点小进步~