商品描述:
基本信息
书名:Python数据分析实战
定**价:59.00元
作者: 内利(Fabio Nelli) 著,杜春晓 译
出版社:人民邮电出版社
出版日期:2016-08-01
ISBN:9787115432209
字数:
页码:290
版次:1
装帧:平装
开本:16开
目录
目录 n
n
致谢 n
译者序 n
第1 章 数据分析简介 1 n
1.1 数据分析 1 n
1.2 数据分析师的知识范畴 2 n
1.2.1 计算机科学 2 n
1.2.2 数学和统计学 3 n
1.2.3 机器学习和人工智能 3 n
1.2.4 数据来源领域 3 n
1.3 理解数据的性质 4 n
1.3.1 数据到信息的转变 4 n
1.3.2 信息到知识的转变 4 n
1.3.3 数据的类型 4 n
1.4 数据分析过程 4 n
1.4.1 问题定义 5 n
1.4.2 数据抽取 6 n
1.4.3 数据准备 6 n
1.4.4 数据探索和可视化 7 n
1.4.5 预测模型 7 n
1.4.6 模型评估 8 n
1.4.7 部署 8 n
1.5 定量和定性数据分析 9 n
1.6 开放数据 9 n
1.7 Pytho和数据分析 11 n
1.8 结论 11 n
第2 章 Pytho世界简介 12 n
2.1 Python——编程语言 12 n
2.2 Python——解释器 13 n
2.2.1 Cytho14 n
2.2.2 Jytho14 n
2.2.3 PyPy 14 n
2.3 Pytho2 和Pytho3 14 n
2.4 安装Pytho15 n
2.5 Pytho发行版 15 n
2.5.1 Anaconda 15 n
2.5.2 Enthought Canopy 16 n
2.5.3 Python(x,y) 17 n
2.6 使用Pytho17 n
2.6.1 Pythoshell 17 n
2.6.2 运行完整的Pytho程序 17 n
2.6.3 使用IDE 编写代码 18 n
2.6.4 跟Pytho交互 18 n
2.7 编写Pytho代码 18 n
2.7.1 数学运算 18 n
2.7.2 导入新的库和函数 19 n
2.7.3 函数式编程 21 n
2.7.4 缩进 22 n
2.8 IPytho23 n
2.8.1 IPythoshell 23 n
2.8.2 IPythoQt-Console 24 n
2.9 PyPI 仓库——Pytho包索引 25 n
2.10 多种PythoIDE 26 n
2.10.1 IDLE 26 n
2.10.2 Spyder 27 n
2.10.3 Eclipse(pyDev) 27 n
2.10.4 Sublime 28 n
2.10.5 Liclipse 29 n
2.10.6 NinjaIDE 29 n
2.10.7 Komodo IDE 29 n
2.11 SciPy 30 n
2.11.1 NumPy 30 n
2.11.2 pandas 30 n
2.11.3 matplotlib 31 n
2.12 小结 31 n
第3 章 NumPy 库 32 n
3.1 NumPy 简史 32 n
3.2 NumPy 安装 32 n
3.3 ndarray:NumPy 库的心脏 33 n
3.3.1 创建数组 34 n
3.3.2 数据类型 34 n
3.3.3 dtype 选项 35 n
3.3.4 自带的数组创建方法 36 n
3.4 基本操作 37 n
3.4.1 算术运算符 37 n
3.4.2 矩阵积 38 n
3.4.3 自增和自减运算符 39 n
3.4.4 通用函数 40 n
3.4.5 聚合函数 40 n
3.5 索引机制、切片和迭代方法 41 n
3.5.1 索引机制 41 n
3.5.2 切片操作 42 n
3.5.3 数组迭代 43 n
3.6 条件和布尔数组 45 n
3.7 形状变换 45 n
3.8 数组操作 46 n
3.8.1 连接数组 46 n
3.8.2 数组切分 47 n
3.9 常用概念 49 n
3.9.1 对象的副本或视图 49 n
3.9.2 向量化 50 n
3.9.3 广播机制 50 n
3.10 结构化数组 52 n
3.11 数组数据文件的读写 53 n
3.11.1 二进制文件的读写 54 n
3.11.2 读取文件中的列表形式数据 54 n
3.12 小结 55 n
第4 章 pandas 库简介 56 n
4.1 pandas:Pytho数据分析库 56 n
4.2 安装 57 n
4.2.1 用Anaconda 安装 57 n
4.2.2 用PyPI 安装 58 n
4.2.3 在Linux 系统的安装方法 58 n
4.2.4 用源代码安装 58 n
4.2.5 Windows 模块仓库 59 n
4.3 测试pandas 是否安装成功 59 n
4.4 开始pandas 之旅 59 n
4.5 pandas 数据结构简介 60 n
4.5.1 Series 对象 60 n
4.5.2 DataFrame 对象 66 n
4.5.3 Index 对象 72 n
4.6 索引对象的其他功能 74 n
4.6.1 更换索引 74 n
4.6.2 删除 75 n
4.6.3 算术和数据对齐 77 n
4.7 数据结构之间的运算 78 n
4.7.1 灵活的算术运算方法 78 n
4.7.2 DataFrame 和Series 对象之间的运算 78 n
4.8 函数应用和映射 79 n
4.8.1 操作元素的函数 79 n
4.8.2 按行或列执行操作的函数 80 n
4.8.3 统计函数 81 n
4.9 排序和排位次 81 n
4.10 相关性和协方差 84 n
4.11 NaN 数据 85 n
4.11.1 为元素赋NaN 值 85 n
4.11.2 过滤NaN 86 n
4.11.3 为NaN 元素填充其他值 86 n
4.12 等级索引和分级 87 n
4.12.1 重新调整顺序和为层级排序 89 n
4.12.2 按层级统计数据 89 n
4.13 小结 90 n
第5 章 pandas:数据读写 91 n
5.1 I/O API 工具 91 n
5.2 CSV 和文本文件 92 n
5.3 读取CSV 或文本文件中的数据 92 n
5.3.1 用RegExp 解析TXT 文件 94 n
5.3.2 从TXT 文件读取部分数据 96 n
5.3.3 往CSV 文件写入数据 97 n
5.4 读写HTML 文件 98 n
5.4.1 写入数据到HTML 文件 99 n
5.4.2 从HTML 文件读取数据 100 n
5.5 从XML 读取数据 101 n
5.6 读写Microsoft Excel 文件 103 n
5.7 JSON 数据 105 n
5.8 HDF5 格式 107 n
5.9 pickle——Pytho对象序列化 108 n
5.9.1 用cPickle 实现Pytho对象序列化 109 n
5.9.2 用pandas 实现对象序列化 109 n
5.10 对接数据库 110 n
5.10.1 SQLite3 数据读写 111 n
5.10.2 PostgreSQL 数据读写 112 n
5.11 NoSQL 数据库MongoDB 数据读写 114 n
5.12 小结 116 n
第6 章 深入pandas:数据处理 117 n
6.1 数据准备 117 n
6.2 拼接 122 n
6.2.1 组合 124 n
6.2.2 轴向旋转 125 n
6.2.3 删除 127 n
6.3 数据转换 128 n
6.3.1 删除重复元素 128 n
6.3.2 映射 129 n
6.4 离散化和面元划分 132 n
6.5 排序 136 n
6.6 字符串处理 137 n
6.6.1 内置的字符串处理方法 137 n
6.6.2 正则表达式 139 n
6.7 数据聚合 140 n
6.7.1 GroupBy 141 n
6.7.2 实例 141 n
6.7.3 等级分组 142 n
6.8 组迭代 143 n
6.8.1 链式转换 144 n
6.8.2 分组函数 145 n
6.9 高级数据聚合 145 n
6.10 小结 148 n
第7 章 用matplotlib 实现数据可视化 149 n
7.1 matplotlib 库 149 n
7.2 安装 150 n
7.3 IPytho和IPythoQtConsole 150 n
7.4 matplotlib 架构 151 n
7.4.1 Backend 层 152 n
7.4.2 Artist 层 152 n
7.4.3 Scripting 层(pyplot) 153 n
7.4.4 pylab 和pyplot 153 n
7.5 pyplot 154 n
7.5.1 生成一幅简单的交互式图表 154 n
7.5.2 设置图形的属性 156 n
7.5.3 matplotlib 和NumPy 158 n
7.6 使用kwargs 160 n
7.7 为图表添加更多元素 162 n
7.7.1 添加文本 162 n
7.7.2 添加网格 165 n
7.7.3 添加图例 166 n
7.8 保存图表 168 n
7.8.1 保存代码 169 n
7.8.2 将会话转换为HTML 文件 170 n
7.8.3 将图表直接保存为图片 171 n
7.9 处理日期值 171 n
7.10 图表类型 173 n
7.11 线性图 173 n
7.12 直方图 180 n
7.13 条状图 181 n
7.13.1 水平条状图 183 n
7.13.2 多序列条状图 184 n
7.13.3 为pandas DataFrame 生成多序列条状图 185 n
7.13.4 多序列堆积条状图 186 n
7.13.5 为pandas DataFrame 绘制堆积条状图 189 n
7.13.6 其他条状图 190 n
7.14 饼图 190 n
7.15 高级图表 193 n
7.15.1 等值线图 193 n
7.15.2 极区图 195 n
7.16 mplot3d 197 n
7.16.1 3D 曲面 197 n
7.16.2 3D 散点图 198 n
7.16.3 3D 条状图 199 n
7.17 多面板图形 200 n
7.17.1 在其他子图中显示子图 200 n
7.17.2 子图网格 202 n
7.18 小结 204 n
第8 章 用scikit-lear库实现机器学习 205 n
8.1 scikit-lear库 205 n
8.2 机器学习 205 n
8.2.1 有监督和无监督学习 205 n
8.2.2 训练集和测试集 206 n
8.3 用scikit-lear实现有监督学习 206 n
8.4 Iris 数据集 206 n
8.5 K-近邻分类器 211 n
8.6 Diabetes 数据集 214 n
8.7 线性回归:方回归 215 n
8.8 支持向量机 219 n
8.8.1 支持向量分类 219 n
8.8.2 非线性SVC 223 n
8.8.3 绘制SVM 分类器对Iris 数据集的分类效果图 225 n
8.8.4 支持向量回归 227 n
8.9 小结 229 n
第9 章 数据分析实例——气象数据 230 n
9.1 待检验的假设:靠海对气候的影响 230 n
9.2 数据源 233 n
9.3 用IPythoNotebook 做数据分析 234 n
9.4 风向频率玫瑰图 246 n
9.5 小结 251 n
第10 章 IPythoNotebook 内嵌JavaScript 库D3 252 n
10.1 开放的人口数据源 252 n
10.2 JavaScript 库D3 255 n
10.3 绘制簇状条状图 259 n
10.4 地区分布图 262 n
10.5 2014 年美国人口地区分布图 266 n
10.6 小结 270 n
第11 章 识别手写体数字 271 n
11.1 手写体识别 271 n
11.2 用scikit-lear识别手写体数字 271 n
11.3 Digits 数据集 272 n
11.4 学习和预测 274 n
11.5 小结 276 n
附录A 用LaTeX 编写数学表达式 277 n
附录B 开放数据源 287