python获取并解析电影评分Top 250的电影名称、评分和电影类型,并统计分析出哪些电影类型占比居多(最终结果显示剧情类型的电影占比最多)

一、实现目标

      python编写一个简易的爬虫程序,获取电影有史以来的电影评分最高的前250部电影的名称和评分,获取的数据存储到exce文件中。之后统计分析出哪些电影类型占比居多。


二、实现思路

       1、找到电影评分Top250的页面

        2、分析该网页的数据结构,找到要解析的数据在哪个位置,什么结构

        3、分析每一页数据的url格式,找出规律,从而实现多页的爬取

       4、编程实现,向目标网页发送请求,解析html数据,修改url,多页爬取。最后写入excel文件。

        5、读取excel文件中的电影数据,统计分析出哪种类型占比更多,更受欢迎。


三、代码实现

1、导入需要使用到的库:

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
EKVOD2.0正式版特点: 一、全新的后台设计 1、添加管理影片: 添加影片管理影片更方便,分类添加和管理更加简单化,支持分类别名,分类页模版设置,增加影片专题功能,增加tag标签,增加按字母分类影片,连载管理,推荐管理,影片报错等功能管理! 2、生成静态页管理: 可以一键生成全站,也可以按照分类页生成,也可按照内容页ID生成,可以选择生产当日,或者3天内的影片,生成网站地图,google和baidu地图,rss文件,js文件等,专题生成页面,自定义页面生成等! 3、强大的自定义采集: 可以按照站点添加采集分类,可以整站一键采集,也可以分开采集,操作更加灵活!采集分类设置更加灵活,可以指定分类,也可采集目标站的分类然后按照系统设置的自动转化分类,可以指定只采集最近 几天内的影片,播放器也可以自由选择! 在线规则测试,强大的替换功能,强大的插件支持功能,强大的防盗链突破功能,能让您更方便采集任何站点! 采集入库到临时数据库,方便管理和入库操作,临时数据库管理功能可以方便您修改和管理采集的影片,可以避免因采集错误而造成的网站问题,入库可以设置当遇到同影片时:智能覆盖、地址头部追加、地址尾部追加、覆盖地址、新增数据、仅更新地址以外的信息等,可以选择各种入库方式! 导导入规则更加方便,导规则以base64方式加密,分享方便不会丢失数据! 4、模版标签管理: 后置直接管理模版文件,可以编辑、添加模版,模版标签向导等,自定义标签添加管理等! 5、集成高级工具 重复数据检测可以方便您查看数据库里是否有同名的影片,数据批量替换功能让您方便的替换影片数据库里的影片名、影片简介等,删除指定来源功能可以删除指定的来源数据,数据库备份、数据库还原、数据库优化等功能,强大的计划任务功能:可以在制定时间自动执行指定的文件,在需要的情况下,您也可以方便的将其用于程序功能的扩展!文件校验是木马扫描工具可以让您检测您的网站是否被植入恶意程序! 6、扩展选项 后台可以直接设置广告文件,调用广告代码,友情链接管理等! 7、系统设置 系统参数设置:可以在后台一键切换动态运行模式、静态运行模式、伪静态运行模式,可以设置前台文件夹名称,选择运行方式等,设置各种重要设置! 播放器设置,播放来源设置:可以设置播放来源在前台显示的顺序 系统管理员管理,可以设置系统管理员(拥有全部权限) 和网站编辑(只拥有数据管理权限)等 8、在线升级功能 如果有新文件后台会提示升级,直接可以在后台在线升级! 9、资源库在线采集功能 可以直接采集官方资源库,用鼠标点几下就能获得大量的数据! 10、数据库图片在线下载功能 程序自动检测有无外连图片并提示下载,可以突破防盗链的图片 二、强大缓存系统 EKVOD2.0使用全新的缓存方式,可以缓存模版、缓存数据库,在后台直接设置切换,让您的系统运行的更加流畅,生成静态页面更加迅速,后台生成静态页面速度可以达到每秒100页(非最高生成速度),打开动态页面只需要0.00几秒,开启数据库缓存基本不读数据库,可以更大的节省资源! 三、强大而灵活的模版标签: 2.0新增了tag标签,letter字母标签,专辑标签等,更灵活的万能时间标签,万能分页标签等,详情请查看压缩包里的说明文件! 四、可以自定义播放器文件 可以自己设置自己需要的播放器,灵活添加,灵活设置! 五、强大的负载能力和安全过滤功能 数据库设计模式和缓存功能可以承受更大的在线人数,严格的安全过滤经专业代码安全审计人员审计过,让您的系统运行的更安全快捷!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

阳光宅男xxb

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值