采集 FALSH,文本都可以的。
采集流程大概就是:
1:先登录,
2 :查看源代码
3:找到下载地址下载
现在我们来实现一个自动侦测到网页源代码的程序。
代码展示:
/**
* 方法实现说明 自动侦测到网页源代码
* @author 金刚
* @date 2021/3/30 14:40
*/
public static String getWebContent(String domain){
System.out.println("开始读取内容...("+domain+")");
StringBuffer sb = new StringBuffer();
try{
java.net.URL url = new java.net.URL(domain);
BufferedReader in =
new BufferedReader(new InputStreamReader(url