java爬取网页的爬虫(html文件)

这篇博客介绍了如何创建一个简单的Java爬虫项目。首先通过Maven建立项目,然后添加HttpClient依赖。运行代码后,可以看到成功发送了Get请求,状态码200表示请求成功,爬取到了HTML文件内容,但内容显示在一行上,需要进一步处理才能美化展示。
摘要由CSDN通过智能技术生成

1.首先创建一个maven项目,相信大家都不是问题了
2.配置maven的依赖在创建好的maven项目里的pom文件中

  • 添加httpClient依赖
    在maven共享库中下载
    此处maven共享库链接
    在这里插入图片描述
    在这里插入图片描述
    将此处代码贴到maven项目的pom.xml中
    在这里插入图片描述
    在这里插入图片描述
    到这里一个简陋的 小爬虫就算完成了 一起看看效果吧,让我们run 一把

在这里插入图片描述
结果显示的日志看到 请求为Get请求 ,状态码200 表示请求成功,别的就不一一叙述了,下面是爬取到的html文件内容

在这里插入图片描述
奈何整个文件内容都在一行上了 ,真的是不太美观,不过不影响,其实自己是不会将它显示原样的,有明白的大佬求告知,不胜感激。今天就到这了,是不是很简单?吼吼吼吼吼吼吼吼(才没有。。。。。)该睡觉了。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值