版权声明:以上文章中所选用的图片及文字来源于网络以及用户投稿,由于未联系到知识产权人或未发现有关知识产权的登记,如有知识产权人并不愿意我们使用,如果有侵权请立即联系:55525090@qq.com,我们立即下架或删除。
简介:《用 Python 玩转数据》数据分析项目
一、程序功能
基于 MovieLens 100k 数据集中男性女性对电影的评分来判断男性还是女性电影
评分的差异性更大。
二、数据来源
数据集下载:
http://files.grouplens.org/datasets/movielens/ml-100k.zip
数据含义:
u.data 表示 100k 条评分记录,每一列的数值含义是:
user id | item id | rating | timestamp
u.user 表示用户的信息,每一列的数值含义是:
user id | age | gender | occupation | zip code
u.item 文件表示电影的相关信息,每一列的数值含义是:
movie/item id | movie title | release date | video release date |IMDb URL | unknown |
Action | Adventure | Animation | Children's | Comedy | Crime | Documentary | Drama |
Fantasy |Film-Noir | Horror | Musical | Mystery | Romance | Sci-Fi |Thriller | War |