数据说明
datas文件夹下有三个csv文件,分别是users.csv,movies.csv,ratings.csv
users.csv是用户信息,有userId,name,phone,pwd字段,分别表示用户Id,用户姓名,电话号码,密码。
movies.csv是电影信息,有movieId,movieName,actors,movieAmount,content字段,分别表示电影id,电影名称,主演,播放量,电影简介
ratings.csv是评分信息,有userId,movieId,rating字段,分别表示用户id,电影id,评分;也即某个用户对某部电影的评分,评分为5分制。
实验任务
-
读取movies.csv文件,并修改content字段名改为introduction,将修改结果更新到movies.csv文件中。
-
将电影信息按播放量降序排序。
-
找出评分电影次数最多的前10名用户,输出结果为用户姓名,评分次数。
-
结合评分表,得出每部电影的评分均值,输出结果电影名称,评分均值
构建数据
由于本次数据量较大,种类较多,而且老师还不提供数据。所以我不得不采用了python库Faker来构建测试数据。