R语言爬虫电影票房-艺恩网

最新推荐文章于 2024-07-24 10:38:58 发布

diao-j

最新推荐文章于 2024-07-24 10:38:58 发布

阅读量2.7k

点赞数 3

分类专栏： R语言文章标签：爬虫 R语言电影票房艺恩网

本文链接：https://blog.csdn.net/tayangdang1058/article/details/88945715

版权

一、爬取目的：
爬取数据用于论文-大数据背景下我国电影票房预测研究
数据来源：http://www.cbooo.cn/

二、思路解析：

爬取首页电影名称+ID
拼接 http://www.cbooo.cn/m/ + ID 获取电影详情页

library(tidyverse)
library(httr)
library(jsonlite)
library(rlist)
library(plyr)
##tidyverse：包含R语言常用的8个包，合集
##httr：相当于py的Request库，

#获取总览页
yien_data <- data.frame()
for (i in 1:395){
    url <- paste('http://www.cbooo.cn/Mdata/getMdata_movie?area=50&type=0&year=0&initial=%E5%85%A8%E9%83%A8&pIndex=',i,seq='')
    
    Sys.sleep(0.5) 
    
    response <- GET(url, user_agent="Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36")
   
    result <- fromJSON(content(response,as="

最低0.47元/天解锁文章

diao-j

关注

3
点赞
踩
30

收藏

觉得还不错? 一键收藏
4
评论
R语言爬虫电影票房-艺恩网

一、爬取目的：爬取数据用于论文-大数据背景下我国电影票房预测研究数据来源：http://www.cbooo.cn/二、思路解析：爬取首页电影名称+ID拼接 http://www.cbooo.cn/m/ + ID 获取电影详情页library(tidyverse)library(httr)library(jsonlite)library(rlist)library(ply...
复制链接

扫一扫