用Jsoup包抓取网页数据


import java.io.File;
import java.util.ArrayList;
import java.util.List;


import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;


import jxl.Workbook;
import jxl.write.Label;
import jxl.write.WritableSheet;
import jxl.write.WritableWorkbook;


public class DlTiltle {
public static void main(String[] args){
DlTiltle();
}


public static void DlTiltle(){
try{
Document doc = Jsoup.connect("url地址")
.timeout(5000).get();
Elements tables = doc.select("table.data_detail");

for(Element table : tables){
try{
Elements table_2 = table.select(">tbody>tr>td>table>tbody>tr>td>table>tbody>tr>td>table>tbody>tr>td>ul>li>table>tbody>tr");
List<String> titleArr = new ArrayList<String>();
for(Element _table : table_2){
Elements table_goal = _table.select(">td>a>font");

for(Element title : table_goal){
System.out.println(title.text());
titleArr.add(title.text());

}
 
}
System.out.println(titleArr.size());
try {  
           // 打开文件  
           WritableWorkbook book = Workbook.createWorkbook(new File(  
                   "E:/title.xls"));  
           // 生成名为“sheet1”的工作表,参数0表示这是第一页  
           WritableSheet sheet = book.createSheet("sheet1", 0);  
           // 在Label对象的构造子中指名单元格位置是第一列第一行(0,0),单元格内容为string  
           for(int i=0; i<titleArr.size();i++){
            Label label = new Label(0, i, titleArr.get(i));
            // 将定义好的单元格添加到工作表中  
            sheet.addCell(label);  
           }
             
           
           // 生成一个保存数字的单元格,单元格位置是第二列,第一行,单元格的内容为1234.5  
           // 写入数据并关闭文件  
           book.write();  
           book.close();  
       } catch (Exception e) {  
           System.out.println(e);  
       } 
}catch(Exception e){

}
}
}catch(Exception e){
e.getStackTrace();
}
}


}



  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值