5杀电影 walker 的评分8.0以上的电影

原创 2017年04月14日 10:46:01
http://v5.lol5s.com/v/6802.html 《冲天》 - 冲天 五杀电影院评分: 8.6
http://v5.lol5s.com/v/6775.html 《硫磺岛的来信》 - 硫磺岛的来信 五杀电影院评分: 8.0


附代码:

/**
 * 5杀电影
 *
 * @author yangpan3
 * @since 2017/4/13 13:11
 */
public class MovieWalker {

    public static void main(String[] args) throws Exception {
        int page = 2;
        while (page < 187) {
            load(page++);
            TimeUnit.SECONDS.sleep(10);
        }

//        movie("http://v5.lol5s.com/v/8112.html");
    }

    private static void load(int page) throws Exception {
        System.out.println(page);
        Document doc = Jsoup.connect(String.format("http://v5.lol5s.com/tv/2-%s.html", page)).userAgent("Mozilla").get();

        Elements elements = doc.select("#data_list a");
        for (Element element : elements) {
            String href = element.attr("href");
            movie("http://v5.lol5s.com" + href);
        }
    }

    private static void movie(String url) throws Exception {
        List list = new ArrayList();
        System.out.println(url);
        list.add(url);
        try {
            Document doc = Jsoup.connect(url).userAgent("Mozilla").get();
            list.add(doc.title());
            Elements elements = doc.select("#movie_info_ul li");
            for (Element element : elements) {
                list.add(element.text());
            }
            Elements infos = doc.select("#movie_info_intro_s");
            list.add(infos.text());
        } catch (IOException e) {
            System.out.println("Exception:" + url);
            list.add("Exception:" + url);
        }

        FileUtils.writeStringToFile(new File("D:/experiment/movies", "index.csv"), StringUtils.join(list, ",") + IOUtils.LINE_SEPARATOR_WINDOWS, "UTF-8", true);
        TimeUnit.SECONDS.sleep(10);
    }

}

版权声明:本文为博主原创文章,未经博主允许不得转载。

(7)Python爬虫——爬取豆瓣电影Top250

利用python爬取豆瓣电影Top250的相关信息,包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容,然后将爬取的信息写入Excel表中...
  • Fighting_No1
  • Fighting_No1
  • 2016年03月18日 19:22
  • 6072

使用爬虫爬取豆瓣2016电影榜单中所有电影

更多技术文章请访问我的个人博客## 爬虫每日篇—-今天使用爬虫爬取豆瓣2016电影榜上所有电影信息,本来以为豆瓣这种大社区的防御做的会很好,看到是HTTPS协议,我都准备写一大串头部去模拟用户了,没想...
  • rain_web
  • rain_web
  • 2017年02月09日 14:30
  • 2122

IMDB排名前100名经典电影

IMDB中文名称是互联网电影资料库,是目前全球互联网中最大的一个电影资料库,里面包括了几乎所有的电影,以及1982年以后的电视剧集。IMDB的资料中包括了影片的众多信息,演员、片长、内容介绍、分级、评...
  • u011677147
  • u011677147
  • 2015年09月25日 17:38
  • 1604

电影评分脚本

  • 2013年03月18日 10:33
  • 38KB
  • 下载

c#窗体写“电影评分”

  • 2011年12月12日 16:32
  • 694KB
  • 下载

豆瓣电影名称类别评分时长评论年份爬取主函数

  • 2016年10月10日 21:03
  • 14KB
  • 下载

大数据Spark “蘑菇云”行动补充内容第69课: Spark SQL案例之分析电影评分系统.

大数据Spark “蘑菇云”行动补充内容第69课: Spark SQL案例之分析电影评分系统. 昨天的作业dataframe的 算子实现 : import org.apache.spark.sql.t...
  • duan_zhihua
  • duan_zhihua
  • 2016年10月29日 20:51
  • 570

【TJOI2014】电影评分(movie)

DescriptionInputOutput对于每个询问输出答案Sample Input10 R 1 1 1 R 2 2 1 2 C 2 2 R 3 1 2 Q 1 C 3 2 C 1 ...
  • u011056504
  • u011056504
  • 2017年04月01日 22:01
  • 659

IMDB评分TOP250部给力电影

IMDb--英文全称Internet Movie Database,即互联网电影数据库,是一个关于电影、电影演员、电视节目、电视明星、电子游戏和电影制作小组的在线数据库。IMDb是目前全球互联网中最大...
  • rwecho
  • rwecho
  • 2011年08月13日 10:50
  • 1923

IMDb是怎么给电影评分的?

最近几天,中文互联网上最专业的影评网站“豆瓣电影”成为了电影界激烈讨论的对象。一篇来自广电总局官办的《中国电影报》的文章,称豆瓣电影以及其他社交平台上“个别大V、公众号为博眼球、圈粉丝、流量变现等目的...
  • Real_Myth
  • Real_Myth
  • 2016年12月30日 16:17
  • 726
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:5杀电影 walker 的评分8.0以上的电影
举报原因:
原因补充:

(最多只允许输入30个字)