Excel处理数据不够用了?pandas创始人手把手教你利用Python进行数据分析

为什么要利用Python进行数据分析?

对于数据分析师从业者而言,经常需要从事:数据库操作、报告撰写、数据可视化、数据挖掘的工作。这些工作不写代码也可以操作,利用 Excel 进行数据可视化、使用 SPSS 等一些亲民类平台工具进行数据挖掘,虽然使用平台工具虽然可造作性强,但是不可避免的会存在重复机械的劳动,从而降低自己的工作效率,但如果你会用 Python 编写代码,操作的自由度更高,发展的潜力更大。

怎么利用Python进行数据分析?

在这里推荐这本《利用Python进行数据分析》,该书适合刚刚接触Python的数据分析的小白。将IPython这个交互式Shell作为你的首要开发环境,讲述了从pandas库的数据分析工具开始利用高性能工具等内容。

直接来展示一下:

第1章 准备工作

1.1 本书的内容
1.2 为什么要使用Python进行数据分析
1.3 重要的Python库
1.4 安装和设置

在这里插入图片描述

第2章 Python语法基础,IPython和Jupyter Notebooks

2.1 Python解释器
2.2 IPython基础
2.3 Python语法基础
在这里插入图片描述在这里插入图片描述

第3章 Python的数据结构、函数和文件

3.1 数据结构和序列
3.2 函数
3.3 文件和操作系统
3.4 结论
在这里插入图片描述

第4章 NumPy基础:数组和矢量计算

4.1 NumPy的ndarray:一种多维数组对象
4.2 通用函数:快速的元素级数组函数
4.3 利用数组进行数据处理
4.4 用于数组的文件输入输出

在这里插入图片描述

第5章 pandas入门

5.1 pandas的数据结构介绍
5.2 基本功能
5.3 汇总和计算描述统计
5.4 总结

在这里插入图片描述

第6章 数据加载、存储与文件格式

6.1 读写文本格式的数据
6.2 二进制数据格式
6.3 Web APIs交互
6.4 数据库交互
6.5 总结

在这里插入图片描述

第7章 数据清洗和准备

7.1 处理缺失数据
7.2 数据转换
7.3 字符串操作
7.4 总结

在这里插入图片描述在这里插入图片描述

第8章 数据规整:聚合、合并和重塑

8.1 层次化索引
8.2 合并数据集
8.3 重塑和轴向旋转
8.4 总结
在这里插入图片描述

第9章 绘图和可视化

9.1 matplotlib API入门
9.2 使用pandas和seaborn绘图
9.3 其它的Python可视化工具
9.4 总结
在这里插入图片描述

第10章 数据聚合与分组运算

10.1 GroupBy机制
10.2 数据聚合
10.3 apply:一般性的“拆分-应用-合并”
10.4 透视表和交叉表
10.5 总结
在这里插入图片描述

第11章 时间序列

11.1 日期和时间数据类型及工具
11.2 时间序列基础
11.3 日期的范围、频率以及移动
11.4 时区处理

在这里插入图片描述

第12章 pandas高级应用

12.1 分类数据
12.2 GroupBy高级应用
12.3 链式编程技术
12.4 总结

在这里插入图片描述

第13章 Python建模库介绍

13.1 pandas与模型代码的接口
13.2 用Patsy创建模型描述
13.3 statsmodels介绍
13.4 scikit-learn介绍
13.5 继续学习
在这里插入图片描述

第14章 数据分析案例

14.1 来自Bitly的USA.gov数据
14.2 MovieLens 1M数据集
14.3 1880-2010年间全美婴儿姓名
14.4 USDA食品数据库
14.5 2012联邦选举委员会数据库
14.6 总结

在这里插入图片描述

篇幅有限,这里就不过展示,有需要这份资料的,可以在评论区留言数据分析,我看到就会回复。

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值