经常用Teleport扒站,扒下来的页面中含有大量的tppabs标签,这是teleport自动添加进去的。浏览器不认,也用不到,而且还占用了大量的空间拖延网页的加载速度。所以一定要消灭之。
Editplus下删除(注意此替换不能保证数据的严密性):
使用替换功能,勾选“正则表达式”。查找
tppabs=\"h[^\"]*\"
替换里面什么都不填,全部替换为空。
还有类似javascript:if(confirm(…))window.location=…的语句也需要删除下
查找
javascript\:if\(confirm\([^)]+\)\)window\.location='([^']+)'
替换为
\1
全部替换即可。
Dreamweaver下删除:
查找
\btppabs="h[^"]*"
替换为空。
查找
href="javascript:if\(confirm\('htt[^"]*"
替换为
href="#"
也可以替换成指定的地址。
查找
tpa=http://[^\s]*.gif
替换为
(空)
tpa=http://[^\s]*.jpg
替换为
(空)
tpa=http://[^\s]*.png
替换为
(空)
注意此时不需加正则替换
/**/
替换为
(空)