序言
Python 数据分析
获取操作,处理,清洗和挖掘数据集的完整Python指令。更新到Python3.6,这个再版的亲身实践的指南,是一个向你凸显怎样有效地解决大数据分析问题集合的案例实践。在这个过程中你将学习最新版本的pandas,NumPy,IPython和 Jupyter。
作者 Wes Mckinney,同时也是 Python pandas project的作者,这是一本非常实用的,前沿介绍Python中数据科学工具的书籍。这对于分析新的Python和Python 项目中新的数据科学和科学计算是十分理想的。GitHub上提供了数据文件和相关资料。
- 使用 IPython shell 和 Jupyter Notebooks 进行探究性计算;
- 学习 Numpy 的基础和高级功能;
- 开始使用 pandas 库中的数据分析工具;
- 灵活地使用工具进行加载,清洗,变换,合并,和改造数据;
- 使用 matplotlib 创建有效信息可视化;
- 应用 pandas 分组工具对数据集进行切片,切块,和汇总;
- 分析和处理规则和不规则的时间序列数据;
- 学习怎样通过彻底的,详细的例子来处理真实世界数据分析问题。