java要期末考试了,老师竟然说不考试卷,要我们写程序来打分......我没有一点点防备...言归正传,我准备写一个百度贴吧爬虫给他,为了方便,使用jsoup来进行解析爬取。
用我们学校贴吧进行试验(桂林理工大学吧),这个只是个简单的试验品,不喜勿喷。
使用jsoup来进行解析爬取。
- Document doc = Jsoup.connect("http://tieba.baidu.com/f?ie=utf-8&kw=%E9%83%91%E7%A7%80%E5%A6%8D")//桂工吧网址
- .userAgent( "Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.15)")
- .timeout(