有时候,会遇到一些页面利用JS,禁止用户通过复制的方式获取页面信息,以此来“威胁”用户进行注册,就如“http://www.360doc.com/content/11/0607/02/6924785_122135028.shtml”这个页面;要么就得通过截图的方式进行存取。
其实,稍微了解网页知识的童鞋就会想到查看网页原代码,但是,如本页的源代码:
<tbody> <tr> <td align="left" valign="top" width="740px"> <span id="articlecontent" οnmοuseup="NewHighlight(event)" style="width: 740px"> 友好的错误提示页面,我们可以自定义错误页面: <br>webxml中的配置 <br>步骤如下: <br>一、打开WEB-INF文件夹下web.xml文件; <br>二、在里面新增: <br><!-- 404 页面不存在错误 --> <br><error-page> <br><error-code>404</error-code> <br><location>/errorpage404.htm</location> <br></error-page> <br><!-- 500 服务器内部错误 --> <br><error-page> <br><error-code>500</error-code> <br><location>/errorpage500.htm</location> <br></error-page> <br><!-- java.lang.Exception异常错误,依据这个标记可定义多个类似错误提示 --> <br><error-page> <br><exception-type>java.lang.Exception</exception-type> <br><location>/exception.htm</location> <br></error-page> <br><br>三、保存web.xml文件,重启应用服务器。 <br><br> |
就是属于夹插着HTML代码和文字,有格式不好的内容。
解决办法就是:
1、看一下自己需要的内容的大致范围,确定前后的html标签,进行一下截取,如:本次就冲“友好的错误提示页面,。。。”开始,到“重启应用服务器。”;
2、在桌面新建一个记事本文件,修改拓展名(不显示拓展名的去“文件夹选项”里设置)并命名为“a.html”,然后选择用记事本打开,然后把刚才的代码复制进去;
3、选择一个浏览器,如新出的金山猎豹,或者谷歌、FireFox,打开这个“a.html”。一般新的浏览器的纠错能力都比较好,即便html标签不规范也能正确解析。
好了,打工告成,你可以复制板式规范的文档了。
Lionden
Double Fifth Festival