java爬取网页的爬虫（html文件）

最新推荐文章于 2024-06-28 14:26:11 发布

姓刘的人运气不会太差

最新推荐文章于 2024-06-28 14:26:11 发布

阅读量4.4k

点赞数

分类专栏： java 爬虫文章标签： java爬虫 Get请求爬虫网页内容爬取网页html文件

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/java_fight/article/details/90617102

版权

这篇博客介绍了如何创建一个简单的Java爬虫项目。首先通过Maven建立项目，然后添加HttpClient依赖。运行代码后，可以看到成功发送了Get请求，状态码200表示请求成功，爬取到了HTML文件内容，但内容显示在一行上，需要进一步处理才能美化展示。

摘要由CSDN通过智能技术生成

1.首先创建一个maven项目，相信大家都不是问题了
2.配置maven的依赖在创建好的maven项目里的pom文件中

添加httpClient依赖
在maven共享库中下载
此处maven共享库链接

将此处代码贴到maven项目的pom.xml中

到这里一个简陋的小爬虫就算完成了一起看看效果吧，让我们run 一把

在这里插入图片描述
结果显示的日志看到请求为Get请求，状态码200 表示请求成功，别的就不一一叙述了，下面是爬取到的html文件内容

在这里插入图片描述
奈何整个文件内容都在一行上了，真的是不太美观，不过不影响，其实自己是不会将它显示原样的，有明白的大佬求告知，不胜感激。今天就到这了，是不是很简单?吼吼吼吼吼吼吼吼（才没有。。。。。）该睡觉了。

姓刘的人运气不会太差

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
2
评论
java爬取网页的爬虫（html文件）

1.首先创建一个maven项目，相信大家都不是问题了2.配置maven的依赖在创建好的maven项目里的pom文件中添加httpClient依赖在maven共享库中下载此处maven共享库链接将此处代码贴到maven项目的pom.xml中到这里一个简陋的小爬虫就算完成了一起看看效果吧，让我们run 一把结果显示的日志看到请求为Get请求，状态码200 ...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。