第1关:统计数据集的基本属性
任务描述
本关卡学习载入数据和分析数据这两个步骤,只有在对数据有一个基本的认识后,才能选择或者设计好后续的机器学习模型算法。
# -*- coding:utf-8 -*-
def stat_data(train_data):
"""求出用户数和电影数,评分数目, 平均评分, 最大评分, 最小评分
参数:
train_data - Pandas的DataFrame对象,有四列'user','movie','rating','timestamp',是训
练数据集
返回值:
num_user - 整数,用户数
num_movie - 整数,电影数
num_rating - 整数,评分数目
avg_rating - 浮点数,平均评分
max_rating - 浮点数,最大评分
min_rating - 浮点数,最小评分
"""
num_user = 0
num_movie = 0
num_rating = 0
avg_rating = 0
max_rating = 0
min_rating = 0
# 请在此添加实现代码
#********** Begin *********#
num_user = train_data['user'].nunique()
num_movie = train_data['movie'].nunique()
num_rating = tra