简单的java爬虫

最新推荐文章于 2023-02-23 15:20:05 发布

sillyerser

最新推荐文章于 2023-02-23 15:20:05 发布

阅读量157

点赞数

分类专栏： JAVA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39667655/article/details/81103779

版权

JAVA 专栏收录该内容

18 篇文章 0 订阅

订阅专栏

记写过的一个简单的java爬虫：（单线程的）

1：创建HttpClient

2：创建请求方法：HttpGet httpGet = new HttpGet(url);

3：设置Header模拟浏览器行为：

httpGet.setHeader("User-Agent","Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36");

4：这样通过httpClient, httpGet可以抓取数据

4.1：发送请求，收取响应，获取网站响应的html，

HttpResponse httpResponse = httpClient.execute(httpGet);

4.2：解析响应

String entity = EntityUtils.toString(httpResponse.getEntity());//得到的String就是页面里面的内容

4.3：再将页面的内容进行解析，获取我们需要的内容，解析方式，采用Jsoup解析

4.3.1：采用Jsoup解析Document doc = Jsoup.parse(html);

4.3.2：//获取html标签中的内容

Elements elements=doc.select("ul[class=item_con_list]").select("li[class=con_list_item default_list]");//此为得到列表中的每个元素

for (Element ele:elements) {

String thingID=ele.attr("data-positionid");/得到数据

.........

.........

Model.setThingID(thingID);///将得到的tingID存入实体类Model

.........

........

}

//将每一个对象的值，保存到List集合中

data.add(Model);

5：将得到的数据存入数据库（将得到model集合data写入数据库即可）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
简单的java爬虫

记写过的一个简单的java爬虫：（单线程的）1：创建HttpClient2：创建请求方法：HttpGet httpGet = new HttpGet(url);3：设置Header模拟浏览器行为：httpGet.setHeader("User-Agent","Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (...
复制链接

扫一扫

专栏目录

sillyerser CSDN认证博客专家 CSDN认证企业博客

码龄7年

41: 原创

33万+: 周排名

175万+: 总排名

3万+: 访问

: 等级

776: 积分

10: 粉丝

32: 获赞

2: 评论

136: 收藏

私信

关注

分类专栏

JAVA 18篇
socket
C++ 3篇
计算机网络 1篇
操作系统 1篇
算法 5篇
mybatis 2篇
springmvc 1篇
spring 4篇
设计模式 1篇
综合学习笔记 4篇
web开发 4篇
大数据 1篇
数据库 1篇
数据结构

最新评论

动态规划--背包问题（01、完全、多重）
weixin_41854375: 老铁你方法二打印信息错了，while（k）下面的if应改为while,因为存在有的物品装多个的情况
STL
木植6N:

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。