Java爬虫:对猫眼电影进行信息采集并存入Excel

该博客介绍了使用Java爬虫针对猫眼电影网站进行信息采集,涉及TOP100榜、最受期待榜等榜单的数据,包括电影图片、名称、上映时间、主演、评分、点评人数等,并详细讲解了获取这些数据的方法,如模拟移动设备或IE浏览器获取特定数据。最后,博主分享了如何将爬取到的信息存储到Excel文件中。
摘要由CSDN通过智能技术生成

采集的目标以及内容

目标:TOP100榜最受期待榜热映口碑榜国内票房榜北美票房榜
内容:图片,电影名,上映时间,主演人员,电影链接,电影评分,总点评人数,想看人数,已看人数。
用到的一些Maven依赖:

<dependency>
      <groupId>com.alibaba</groupId>
      <artifactId>fastjson</artifactId>
      <version>1.2.58</version>
    </dependency>
    <dependency>
      <groupId>org.apache.httpcomponents</groupId>
      <artifactId>httpclient</artifactId>
      <version>4.5.10</version>
    </dependency>
    <dependency>
      <groupId>org.jsoup</groupId>
      <artifactId>jsoup</artifactId>
      <version>1.11.3</version>
    </dependency>
    <!-- https://mvnrepository.com/artifact/org.apache.poi/poi -->
    <dependency>
      <groupId>org.apache.poi</groupId>
      <artifactId>poi</artifactId>
      <version>3.16</version>
    </dependency>

提取的信息封装为一个类

public class Mao {
    private String picLink;//电影图片链接
    private String movie;//电影名
    private String releaseTime;//上映时间
    private String star;//参演人员
    private String movieLink;//链接
    private String score;//电影评分
    private String snum;
    private String watched;
    private String num;
    public Mao(String picLink,String movie,String releaseTime,String star,String movieLink,String score,String snum,String watched,String num){
        this.picLink = picLink;
        this.movie = movie;
        this.releaseTime = releaseTime;
        this.star = star;
        this.movieLink = movieLink;
        this.score = score;
        this.snum = snum;
        this.watched = watched;
        this.num = num;
    }

获得总点评人数,想看人数,已看人数

public List<String> getComment(String movieLink){
        List<String> list = new ArrayList<>(3);
        String movieId = movieLink.substring(movieLink.lastIndexOf("/")+1,movieLink.length());
        String request = "http://m.maoyan.com/asgard/a
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值