“TED演讲”可视化(应统期末作业)(一)

先说好哈,欢迎学习借鉴,请勿直接搬运,好歹你改一改换个逻辑,改改代码再用作你的是吧!天下文章一大抄,就看你会抄不会抄!
一、研究背景和研究目的
(我就不按照小论文那套规规矩矩的写了)
主要是为了完成可视化期末大作业,老师让我们自行选题,本来想做英雄联盟历届比赛可视化,感觉会超级无敌炫酷,后来那些lol里面英文专业术语我实在有点难懂,没文化终究限制了我的发挥
在这里插入图片描述
正题
二、数据概况及清洗
本文所使用的数据均来自于Kaggle上一位叫做鲁纳克·巴尼克的TED粉丝收集的TED官方网站的视频数据。该数据集主要包括两个表,分别为ted_main和transcripts;其中主表ted_main共有2550行数据,17列特征。17列特征中蕴含的信息有:

演讲名称、演讲内容、播放量、评论数量、主要发言人、
主要发言人的职业、发言人数量、主题标签、可选语言、
演讲时长、演讲评级、演讲所属活动、拍摄时间、发布时间、
相关推荐、URL链接

副表则只有两个特征,分别为:演讲稿和URL链接。

2.数据清洗

  • TED所属类别清洗,去除年份后缀,避免类别过多。
  • 与空值处理相似,将数据中明显
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值