电影评价网站记录着观影者对电影的喜好程度和评价信息,通过对相关网站用户评价信息的收集,可以为电影相关的数据的分析和挖掘做支撑,常见的后期应用包括:对电影针对的用户群体做分析、获得大众娱乐/舆情热点、电影推荐(广告推送)等。该场景也可推广至其他行业评价数据的应用。
学习内容参考
01
数据采集概述
本节先帮助学员了解数据采集的相关概念,帮助学员了解数据采集的发展现状及使用场景。
02
网络爬虫概述
本节先帮助学员了解数据采集的实现技术,网络爬虫是最常用的技术之一,帮助学员了解网络爬虫的定义及实现原理。
03
爬虫数据结构
本节先帮助学员了解网络有哪些各种数据,帮助学员重点掌握网页、JSON数据结构。
04
爬虫策略
本节帮助学员重点掌握三种爬虫策略的原理,帮助学员掌握三种爬虫策略的使用场景。
05
爬虫实现
本节先帮助学员掌握URL,帮助学员掌握爬虫的具体实现。
06
ECS产品介绍
本节先帮助学员熟悉采集平台,帮助学员掌握ECS概念及特点。
07
开通云服务器
本节从零开始教会学员如何开通一台空白的Linux云服务器ECS,帮助学员掌握ECS具体操作。
08
项目概述
本节给学员布置了一个任务,配合具体的实现代码,可让学员轻松实现项目的最终结果。
09
项目实现
本节讲解如何从零开始抓取热门电影网站的内容,配合清晰的实操演示,可让学员轻松掌握抓取电影评价数据的技能。
10
基于电影评级数据的采集实验
本实验用户将完整体验一次如何去抓取网站上的电影评价数据,最终用户可以得到有关电影的评价信息。
11
【在线实验】基于电影评价数据的采集
通过本实验,学生能够抓取电影的评价数据,用于后续的分析,例如获得大众娱乐/舆情热点、电影推荐分析等。
关于大数据专项技能认证:电影评价数据的采集:
Apsara Clouder大数据专项技能认证:电影评价数据的采集
(本课程是阿里云大学Apsara Clouder大数据专项技能认证:电影评价数据的采集相关课程,仅能试听免费课时,需购买认证包才能学完全部课时,考取证书。)
阿里云大学官网(阿里云大学 - 官方网站,云生态下的创新人才工场)