Java提取网站后台数据进行处理并排名
一、网页分析
打开网站后,可以看到这个网站的编程语言排名情况。我们选择下图中的图表,这个图表中有2001-2019年的编程语言每个月的使用率,我需要它的数据。
二、数据提取
在网页点右键,点击查看源码:首先我们要编程把源码下载到记事本里,看一下核心代码
1 URL url = newURL(website);2 //根据链接(字符串格式),生成一个URL对象
3 HttpURLConnection urlConnection =(HttpURLConnection) url.openConnection();4 //打开URL
5 BufferedReader reader =new
6 BufferedReader(newInputStreamReader(urlConnection.getInputStream(), encoding));7 //得到输入流
8 Save.saveStr("",file,false);9 //清空记事本文件的内容
10 while ((str = reader.readLine())!= null) {11 //每次读取一行,放入记事本中
12 Save.saveStr(str,file,true);13 Save.saveStr("\r\n",file,true);14 }
下载完成后,我们打开这个