最近在做一个多功能的书签网,首先要解决的就是根据网址获取网页源码。下面是我的实现方法:
这个代码自有其弊端,就是当网址不是一个html网页,而是一个下载文件,那在获取response的时候,时间就会过长,时间过长,会长时间占用服务器资源,非常不利。
所以,解决方法当然是获取整个链接内容前,先得到content-type,或是html,再下载源码。
(实现网址:http://www.hao9483.com:8080/BM/Resister.aspx 该域名没有备案,80端口暂时处于被封阶段)