![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
网络爬虫
cchengone
这个作者很懒,什么都没留下…
展开
-
爬虫之jsoup入门指南
jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。 当时使用它是为了爬某个数据。 Connection con= Jsoup.connect("url");// 传入一个有效的url地址,创建一个连接对象 // 当然,需要判断此次连接是否成功 int cod原创 2016-07-28 12:17:49 · 310 阅读 · 0 评论 -
用HttpClient实现网络爬虫
上一篇爬虫之jsoup入门指南中,已经能够非常便捷的实现网络爬虫 但是,在那之前,尝试了一下用HttpClient实现网络爬虫 在此记录一下 HttpClient client = new HttpClient(); GetMethod get = new GetMethod("url");// 传入url,创建一个get请求,方法体内部应该就是初始化http原创 2016-07-28 12:17:52 · 369 阅读 · 0 评论