资源名称:数据科学导论 Python语言实现 完整pdf
第1章 新手上路1
1.1 数据科学与Python简介1
1.2 Python的安装2
1.2.1 Python 2还是Python 33
1.2.2 分步安装3
1.2.3 Python核心工具包一瞥4
1.2.4 工具包的安装7
1.2.5 工具包升级9
1.3 科学计算发行版9
1.3.1 Anaconda10
1.3.2 Enthought Canopy10
1.3.3 PythonXY10
1.3.4 WinPython10
1.4 IPython简介10
1.4.1 IPython Notebook12
1.4.2 本书使用的数据集和代码18
1.5 小结25
第2章 数据改写26
2.1 数据科学过程26
2.2 使用pandas进行数据加载与预处理27
2.2.1 数据快捷加载27
2.2.2 处理问题数据30
2.2.3 处理大数据集32
2.2.4 访问其他数据格式36
2.2.5 数据预处理37
2.2.6 数据选择39
2.3 使用分类数据和文本数据41
2.4 使用NumPy进行数据处理49
2.4.1 NumPy中的N维数组49
2.4.2 NumPy ndarray对象基础50
2.5 创建NumPy数组50
2.5.1 从列表到一维数组50
2.5.2 控制内存大小51
2.5.3 异构列表52
2.5.4 从列表到多维数组53
2.5.5 改变数组大小54
2.5.6 利用NumPy函数生成数组56
2.5.7 直接从文件中获得数组57
2.5
本书介绍数据科学导论,重点使用Python语言实现。涵盖了Python安装、科学计算发行版的选择、IPython Notebook的使用,以及pandas和NumPy在数据预处理、分类数据和文本数据处理中的应用。此外,还涉及数据科学流程,包括EDA、特征创建、维数约简、异常检测和评分函数等。
最低0.47元/天 解锁文章
265

被折叠的 条评论
为什么被折叠?



