Data Analysis
Sleepallday
生活不止眼前的苟且,还有锅里的肉
展开
-
豆瓣电影TOP250数据分析
本文使用的语言为Python, 用到的几个模块有:BeautifulSoup(爬数据),pandas(数据处理),seaborn(可视化),部分图表由Tableau生成。1. 数据获取计划要抓取的字段包括:片名,导演,年份,国别,评分,评价数量,看过数量,想看数量,短评数量,长评数量。需要抓取的影片信息有250条,每页25部影片,一共有10页。简单浏览网页不难发现,翻页的链接不需要从页面底...原创 2019-02-21 19:27:08 · 9156 阅读 · 3 评论 -
1982年以来NBA发展趋势分析
前言数据集来自Kaggle (https://www.kaggle.com/drgilermo/nba-players-stats),其中包含了1950-1951赛季至2017-2018赛季的球员基本信息以及赛季技术统计。本文旨在通过对这些数据的简单整理归纳,从几个不同的角度,以图表的形式简单分析NBA自1982年以来的一些发展趋势。数据整理清洗主要使用Pandas,可视化工具用到Tableau...原创 2019-03-22 17:03:51 · 1063 阅读 · 0 评论