本章内容为全书学习的准备工作,主要介绍了一下部分内容。
1. 数据的类型
表格型数据
多维数组(矩阵)
相关联的多张表(主键和外键)
时间序列
2. Python进行数据分析的优缺点
解释型语言、胶水语言
效率低
全局解释器锁(GIL)
3. 重要的Python库(数据科学相关)
Numpy
描述待补充。下同。
Pandas
matplotlib
Ipython和jupyter
Scipy
scikit_learn
statsmodels
4. 安装与设置
安装与更新
pip包管理工具
pip install package_name
pip install --upgrade package_name
conda包管理
conda install package_name
conda update package_name
5. 相关术语
伪代码
用一种类似代码的结构形式来描述思路(算法或者过程或者逻辑),事实上并不是有效的源代码。
语法糖
一些代码的便利写法,没有新的功能,但可以简化代码结构。