基于python的电影票房预测系统设计与实现

近些年来,随着电影行业变得越来越热门,也为影院带来不小的票房收入。传统的影院都是依靠个人经验进行排片,但是由于影片的票房收入可能受多种因素的影响,排片多的电影最后的票房会远低于预期值,导致影院因安排失误而导致大量的票房损失。 
基于此背景下,众多的影院希望有一个票房预测系统能够预测电影的票房,为影院的排片进行指导,所以本文在了解了国内外研究现状后,在python语言的基础上,通过爬虫技术爬取中国电影网的各历史票房数据,利用多项式曲线拟合算法作为票房预测算法,实现了可对电影票房进行预测的python系统。
通过应用本系统,能够为国内的影院提供点映过一段时间的电影的预测票房,为影院排片提供有一定影响的参考依据,减少因人为因素对电影排片而导致票房损失的事情发生。同时本系统能够进行票房数据预处理以及模型训练等功能,因为目前电影的票房是用户选择观看电影的重要指标,所以系统还能够及时的变更票房的实时数据和预测数据,具有非常好的应用前景和使用价值。
电影票房预测系统主要是为了对我国所有上映的电影票房进行一个有效的预测,这样更能使投资者或者是观众对电影的选择更为便利。电影票房预测系统进行预测的结构框架是:第一步从中国电影网上爬取电影的基本信息和票房,并对爬取的数据进行分析,经过一系列操作后存储为csv文件。下一步为预测模块,该板块是运用预测算法来训练票房预测模型的同时对票房进行更为精准的预测,最终得到最后的票房结果。
电影票房预测系统分别为网络爬虫子模块、数据存储子模块和电影票房预测子模块。网络爬虫子模块主要完成对中国票房网的真实数据的爬取和预处理,数据存储模块将爬取的数据转换为可输入模型的数据,电影票房预测子模块是本文的核心模块,也是本文的研究重心,主要采用的是基于多项式函数拟合算法的框架模型,以最小二乘法的结果为输入,最终由预先训练好的模型输出票房预测值。

关键词:多项式曲线拟合;电影票房预测;爬虫;python
目  录
一、绪论    1
(一)研究背景    1
(二)国内外研究现状    1
二、相关技术    1
(一)电影票房预测的相关方法    2
1.基于人口统计学的研究方法    2
2.基于MAAP评级的电影票房预测模型    2
(二)网络爬虫介绍    3
1.网络爬虫概述    3
2.页面爬取    3
3.页面存储    4
三、基于python的电影票房预测算法设计    4
(一)数据来源    4
(二)票房预测算法——多项式曲线拟合    4
四、电影票房预测系统需求分析    6
(一)电影票房预测系统总体概述    6
(二)电影票房预测系统功能性需求    6
1.网络爬虫子模块    6
(三)电影票房预测系统非功能性需求    7
五、电影票房预测系统设计    7
(一)    电影票房预测系统整体架构    7
(二)    数据的爬取与清洗子模块    8
(三)数据存储子模块    9
(三)    票房预测子模块    9
六、电影票房预测系统实现    9
(一)系统整体架构实现    9
(二)网络爬虫子模块    10
(三)数据存储子模块    12
七、电影票房预测系统测试    12
(一)硬件环境配置    12
(二)软件环境配置    12
(三)Numpy库与Scipy库    12
(四)预测结果展示    13
1.    电影历史票房结果展示    13
2.电影票房多项式曲线拟合结果展示    13
3.电影预测票房结果展示    14
参考文献    15
 
一、绪论
 

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值