java实现接口爬虫

最新推荐文章于 2024-05-14 19:21:39 发布

继承java之父

最新推荐文章于 2024-05-14 19:21:39 发布

阅读量786

点赞数

文章标签：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52611659/article/details/132428674

版权

用接口方式的爬虫，获取到页面的url

例如csdn的网页：https://silkroad.csdn.net/api/v2/assemble/list/channel/search_hot_word?new_hot_flag=1&channel_name=pc_hot_word&size=20&user_name=qq_52611659&platform=pc&imei=10_19872475880-1689927112269-775170

我需要爬取我之前的搜索关键词,就是从这个接口拿到数据的

第一步复制接口路径的CURL

第二步，复制到apifox当中，类似于这种有足够的请求参数 header和parm

第三步：模仿参数写代码，这样就能爬取到需要参数的值是什么，例如这里是爬取的总条数.

String format = LocalDateTime.now().format(DateTimeFormatter.ofPattern("yyyy年MM月dd日HH时mm分调剂爬虫数据"));
List<AdjustReptileDataBean> data = new ArrayList<>();
JSONObject fieldDescription = new JSONObject();
try {
HttpRequest request = HttpRequest.post("网页的路径");
request.header("Accept", "application/json, text/javascript, */*; q=0.01");
request.header("Content-Type", "application/x-www-form-urlencoded; charset=UTF-8");
request.header("Referer", "https://fe.bnu.edu.cn/pc/cms1info/list/1/13");
Map<String, Object> params = new HashMap<>();
// 不能设置大了。会被重置为20
params.put("columnid", 13);
params.put("page", 1);
request.form(params);
HttpResponse response = request.execute();
int status = response.getStatus();
if (status != 200) {
log.info("网站状态码:{}，不满足爬取逻辑", status);
return;
}
String body = response.body();
JSONObject json = JSONUtil.parseObj(body);
Integer nowNum = json.get("count", Integer.class);

最后拿到nowNum数据之后就证明已经爬取到数据了

继承java之父

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
java实现接口爬虫

例如csdn的网页：https://silkroad.csdn.net/api/v2/assemble/list/channel/search_hot_word?第三步：模仿参数写代码，这样就能爬取到需要参数的值是什么，例如这里是爬取的总条数.
复制链接

扫一扫

继承java之父 CSDN认证博客专家 CSDN认证企业博客

码龄4年

17: 原创

132万+: 周排名

34万+: 总排名

1万+: 访问

: 等级

179: 积分

8: 粉丝

7: 获赞

9: 评论

17: 收藏

私信

关注

热门文章

分类专栏

最新评论

java实现接口爬虫
CSDN-Ada助手: 恭喜您写了第16篇博客！标题“java实现接口爬虫”听起来非常有趣。您的持续创作精神令人钦佩。对于下一步的创作建议，我谨虚心地建议您可以探索一下如何应用爬虫技术解决实际问题，或者分享一些关于爬虫的高级技巧和经验，让读者更深入地了解这个领域。期待您未来更多精彩的博文！
java实现解析html网页爬虫
CSDN-Ada助手: 非常恭喜您完成第17篇博客！标题“java实现解析html网页爬虫”听起来非常精彩。您的坚持和持续创作让我非常钦佩，这对于您的个人成长和知识分享都是极其有益的。在下一步的创作中，我谦虚地建议您可以考虑探索一些更深入的主题，例如如何处理动态网页内容或如何优化爬虫的性能等等。这些主题可能会进一步提升您的技术水平，并为读者提供更多实用的知识和经验。期待您的下一篇博客，再次祝贺您的努力和成就！
小程序实现微信退款
CSDN-Ada助手: 恭喜你写了第13篇博客！标题看起来很有吸引力，我对小程序实现微信退款也很感兴趣。希望你能继续保持创作的热情，分享更多实用的技术经验给读者。如果可以的话，下一步你可以考虑分享一些小程序实现微信退款的具体步骤和注意事项，这样读者们可以更加深入地了解这个过程。当然，我也希望你能保持谦虚的态度，继续分享你的学习心得和遇到的挑战，这样我们也能从中获益。期待你的下一篇博客！
小程序实现微信支付
CSDN-Ada助手: 恭喜你写下了第14篇博客！标题为“小程序实现微信支付”，这听起来像是一个非常实用的主题。你对小程序的研究和分享让我深受启发。接下来，我期待着你能在未来的博客中分享更多关于小程序开发的经验和技巧，比如如何优化支付流程、增加支付安全性等方面的内容。谢谢你的分享，你的博客对像我这样的读者来说真是非常有价值！
处理雪花算法等造成的精度丢失问题
CSDN-Ada助手: 恭喜您撰写第15篇博客！标题中提到的处理雪花算法等造成的精度丢失问题引起了我的兴趣。您在博客中是否探讨了如何解决这个问题呢？如果是的话，我很期待能够读到您的见解和经验。如果还没有，那么我建议您在下一篇博客中可以深入探讨这个主题，分享您对于解决精度丢失问题的思考和建议。继续努力创作吧，我期待您的新作品！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。