学习基于 Wes McKinney 所著的《利用Python进行数据分析》一书,此书因翻译的原因(或者我买的是盗版?119块钱的书67买的,确实有些慌)有一些错误。我尽量改正并加入自己理解,望能帮到各位数据分析师。
by 千月
一、Pandas是做什么的?
Pandas是一个功能强大的开源库,用来进行数据分析,数据操作和数据可视化。形象点来说就是,你的老板给了你一个CSV文件,里面有10000条数据,你需要回给他一个处理好的报表,这个文件每天一份,文件结构几乎一样,你可以选择execl,我也用过execl的vbs编程,基本上可以用反人类来形容编程的过程,去他的DIM。现在同样的工作,使用Pandas和它的小伙伴们可以更轻松的解决,你甚至不用太会编程,这可以说是数据分析师的福音。
二、我可以学Pandas吗?
谁都可以学Pandas。前提是你要有台电脑,至少知道一个编程语言叫Python,而且可以用Python写个非常简单的小代码。这些几乎仅仅需要占用你10分钟的时间。你相信吗?在我写这篇博客的时候win10要默认安装Python了。很快你连安装Python的时间都省了,如果你是Linux环境。别犹豫直接在终端键入Python,开始你的旅程吧。
三、Pandas的安装
首先你要有个Python环境,Linux系统是默认安装有Python的。windows的话,网上大把教程,选python3.5以上的。装好Python后先安装pandas包,使用pip。
pip install pandas