bash修改html文件内容,如何用linux命令或bash脚本解析大量html文件

你可以用ex编辑就地编辑HTML页面,例如:

ex -V1 $PAGE <

" Correcting missing protocol, see: https://github.com/wkhtmltopdf/wkhtmltopdf/issues/2359 "

%s,'//,'http://,ge

%s,"//,"http://,ge

" Correcting relative paths, see: https://github.com/wkhtmltopdf/wkhtmltopdf/issues/2359 "

%s,[^,]\zs'/\ze[^>],'http://www.example.com/,ge

%s,[^,]\zs"/\ze[^>],"http://www.example.com/,ge

" Remove the margin on the left of the main block. "

%s/id="doc_container"/id="doc_container" style="min-width:0px;margin-left : 0px;"/g

%s/

/

/

/

/

/

/id="leaderboard_ad_main">/norm nvatd

/class="page_missing_explanation/norm nvatd

/

/norm nvatd

/

/norm nvatd

/grab_blur_promo_here/norm nvatd

/missing_page_buy_button/norm nvatd

wq " Update changes and quit.

EOF

对于多个文件,请使用bufdo并一次性保存所有文件通过xa。

参见:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值