最容易上手的Java爬虫_爬取豆瓣电影评分

这篇博客介绍了如何利用Java和WebDriver实现豆瓣电影评分的爬取。从环境配置、下载Chrome驱动到设置Maven项目,再到分析网页元素、翻页逻辑以及提取电影信息,详细阐述了整个爬虫的实现过程。最后,博主强调了爬虫并不难,关键在于对页面元素的定位和获取。
摘要由CSDN通过智能技术生成

Java 爬虫

目标

  1. 爬取豆瓣电影的评分
  2. 学习webDriver的基本操作

环境

  1. Java 1.8
  2. IDEA
  3. Windows 10
  4. Chrome浏览器

工具

  1. Chrome驱动
  2. selenium的jar包
  3. 豆瓣电影网站

开始

第一步

下载Chrome驱动,下载地址 http://npm.taobao.org/mirrors/chromedriver
在这里插入图片描述
找一个和自己的Chrome版本差不多的驱动,查看自己Chrome的版本的方法我就不说了,设置里面就可以轻松查到,我的Chrome版本是76.0.3809.132,所以我下载了
在这里插入图片描述

第二步

打开IDEA,创建Maven项目
在这里插入图片描述
输入GroupId和ArtifactId
在这里插入图片描述
然后直接finish就好啦,接着就是把第一步下的驱动解压之后复制到resources目录下,然后导包
打开pom.xml,复制下面的代码

<dependencies>
    <dependency>
        <groupId>org.seleniumhq.selenium</groupId>
        <artifactId>selenium-server</artifactId>
        <version>3.141.59</version>
    </dependency>
</dependencies>

新建一个main类准备开始写代码,下面是我的目录结构
在这里插入图片描述

第三步

配置驱动

//设置webdriver路径
System
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值