在学校学习数据挖掘课程,老师布置的大作业,自己选择了数据集进行分析,写下来做一个分享和记录,如有问题,请指正!
一、数据集选择
在kaggle选择了一个2023年全球YouTube统计数据,链接如下:
二、关于数据集
数据集包含了YouTube订阅者最多的部分频道的相关信息,一共995条数据、28个属性。各个属性名称及介绍如下:
rank:基于订阅者数量的YouTube频道排名
Youtuber:YouTube频道的名称
subscribers:频道订阅者数量
video views:频道上所有视频的总观看次数
category:频道的类别
Title:YouTube频道的标题
uploads:频道上上传的视频总数
Country:YouTube频道的来源国家/地区
Abbreviation:国家缩写
channel_type:YouTube频道的类型(例如个人频道、品牌频道)
video_views_rank:基于总视频观看量的频道排名
country_rank:根据频道所在国家/地区的订阅者数量的频道排名
channel_type_rank:基于渠道类型(个人或品牌)对频道进行排名
video_views_for_the_last_30_days:过去 30 天的总视频播放量