python/java爬虫
javaduqing
duqingfeng.net
展开
-
Jsoup demo
需要一个包:jsoup-1.7.3.jarimport java.io.IOException;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;public class JsoupTest { sta转载 2016-06-08 16:40:08 · 1356 阅读 · 0 评论 -
java爬虫(Jsoup)爬取某站点评论
本文是基于这一篇的:http://blog.csdn.net/disiwei1012/article/details/51614492在上一篇中,我们抓取到了新闻的标题,超链接和摘要,这次我们通过新闻的超链接,进入新闻的评论页,然后爬取评论!注:http://www.wumaow.com,这个网站的标签写的太混乱了,而且还有js报错,到处都是广告。要是不是外国评论翻译的及时,我就去看龙腾网了http原创 2016-06-15 10:02:33 · 4853 阅读 · 2 评论 -
java爬虫(Jsoup)爬取某新闻站点标题
需要一个包:jsoup-1.7.3.jar 有一定的java和js基础的人,一看就懂了! 一个不错的Jsoup中文文档下载地址:http://download.csdn.net/detail/apache2011/4517327import java.io.IOException;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;i原创 2016-06-08 17:14:39 · 8449 阅读 · 5 评论 -
java爬虫(Jsoup爬取龙腾网)第一页信息
如果不懂Jsoup,请看这里:http://blog.csdn.net/disiwei1012/article/details/51614177先看下需要爬取的网页 先看下龙腾网:http://www.ltaaa.com的firebug 再看下我抓取后的: 实体:public class News { private int id; private String title;原创 2016-06-15 11:44:52 · 1106 阅读 · 0 评论