![42c61ec7a8391954028ec65cc50f25c1.png](https://i-blog.csdnimg.cn/blog_migrate/f85a2b7d4c9100b0944d13a033903e96.jpeg)
Python 在数据分析领域里是一门非常强大的语言,在数据分析方面有着出色的生态系统。Pandas 包就是其中之一,它的主要特点是导入和分析数据非常的容易,Pandas 类似 Numpy、Matplotlib,提供了单一且方便的方式来处理数据分析和形象化的工作。
本文中,我们使用 Pandas 来分析 IGN(www.ign.com) 上的游戏评论数据,IGN 是一个颇受欢迎的游戏评论网站。相关数据可以从这里(https://www.kaggle.com/egrinstein/20-years-of-games)获取到,也可以通过我的 Github 获取(https://raw.githubusercontent.com/keer2345/DataAnalysisWithPython/master/myself-notebook/dataquest.io/ign.csv)。通过分析评论数据,我们将学到类似索引等 Pandas 关键的方面。
![5efe0bf0236abad5e400d95be312462e.png](https://i-blog.csdnimg.cn/blog_migrate/15dc8179701d9716a3242ca38462df58.jpeg)
比如类似巫师3(Witcher3)这款游戏,在 PS4 上的评论会比 Xbox One 上更多吗?数据集能帮我们给出结果。
![b71661c4997e85a77d46e151c2edbde5.png](https://i-blog.csdnimg.cn/blog_migrate/5b35ae7aa276343c45ccb861c80fb839.jpeg)
使用Pandas导入数据
首先,我们先查看数据。数据以逗号分隔符来存储,或者 csv 文件,每一行通过换行来分隔,每一列以逗号,来分隔,下面是 ign.csv 文件的前面几行: