python数据分析师书籍_从零开始学Python数据分析与挖掘 Python数据分析师 Numpy数据处理Pandas数据可视化Matplotlib数据挖掘Sklearn技术教程书籍...

目 录

第1章 数据分析与挖掘概述 1

1.1 什么是数据分析和挖掘 1

1.2 数据分析与挖掘的应用领域 2

1.2.1 电商领域——发现破坏规则的“害群之马” 2

1.2.2 交通出行领域——为打车平台进行私人订制 3

1.2.3 医疗健康领域——找到医疗方案 3

1.3 数据分析与挖掘的区别 4

1.4 数据挖掘的流程 5

1.4.1 明确目标 5

1.4.2 数据搜集 6

1.4.3 数据清洗 6

1.4.4 构建模型 7

1.4.5 模型评估 7

1.4.6 应用部署 8

1.5 常用的数据分析与挖掘工具 8

1.6 本章小结 9

第2章 从收入的预测分析开始 10

2.1 下载与安装Anoconda 10

2.1.1 基于Windows系统安装 11

2.1.2 基于Mac系统安装 12

2.1.3 基于Linux系统安装 14

2.2 基于Python的案例实战 14

2.2.1 数据的预处理 14

2.2.2 数据的探索性分析 16

2.2.3 数据建模 19

2.3 本章小结 28

第3章 Python快速入门 29

3.1 数据结构及方法 29

3.1.1 列表 29

3.1.2 元组 34

3.1.3 字典 35

3.2 控制流 38

3.2.1 if分支 38

3.2.2 for循环 39

3.2.3 while循环 41

3.3 字符串处理方法 43

3.3.1 字符串的常用方法 43

3.3.2 正则表达式 45

3.4 自定义函数 47

3.4.1 自定义函数语法 47

3.4.2 自定义函数的几种参数 49

3.5 一个爬虫案例 52

3.6 本章小结 54

第4章 Python数值计算工具——Numpy 56

4.1 数组的创建与操作 56

4.1.1 数组的创建 56

4.1.2 数组元素的获取 57

4.1.3 数组的常用属性 58

4.1.4 数组的形状处理 59

4.2 数组的基本运算符 62

4.2.1 四则运算 62

4.2.2 比较运算 63

4.2.3 广播运算 65

4.3 常用的数学和统计函数 66

4.4 线性代数的相关计算 67

4.4.1 矩阵乘法 68

4.4.2 diag函数的使用 69

4.4.3 特征根与特征向量 69

4.4.4 多元线性回归模型的解 70

4.4.5 多元一次方程组的求解 70

4.4.6 范数的计算 71

4.5 伪数的生成 71

4.6 本章小结 74

第5章 Python数据处理工具——Pandas 76

5.1 序列与数据框的构造 76

5.1.1 构造序列 77

5.1.2 构造数据框 78

5.2 外部数据的读取 79

5.2.1 文本文件的读取 79

5.2.2 电子表格的读取 81

5.2.3 数据库数据的读取 83

5.3 数据类型转换及描述统计 85

5.4 字符与日期数据的处理 89

5.5 常用的数据清洗方法 93

5.5.1 重复观测处理 93

5.5.2 缺失值处理 94

5.5.3 异常值处理 97

5.6 数据子集的获取 99

5.7 透视表功能 101

5.8 表之间的合并与连接 104

5.9 分组聚合操作 107

5.10 本章小结 108

第6章 Python数据可视化 110

6.1 离散型变量的可视化 110

6.1.1 饼图 110

6.1.2 条形图 115

6.2 数值型变量的可视化 125

6.2.1 直方图与核密度曲线 125

6.2.2 箱线图 129

6.2.3 小提琴图 133

6.2.4 折线图 135

6.3 关系型数据的可视化 139

6.3.1 散点图 139

6.3.2 气泡图 142

6.3.3 热力图 144

6.4 多个图形的合并 146

6.5 本章小结 148

第7章 线性回归预测模型 150

7.1 一元线性回归模型 150

7.2 多元线性回归模型 153

7.2.1 回归模型的参数求解 154

7.2.2 回归模型的预测 155

7.3 回归模型的假设检验 157

7.3.1 模型的显著性检验——F检验 158

7.3.2 回归系数的显著性检验——t检验 160

7.4 回归模型的诊断 162

7.4.1 正态性检验 162

7.4.2 多重共线性检验 164

7.4.3 线性相关性检验 165

7.4.4 异常值检验 167

7.4.5 独立性检验 170

7.4.6 方差齐性检验 170

7.5 本章小结 173

第8章 岭回归与LASSO回归模型 174

8.1 岭回归模型 174

8.1.1 参数求解 175

8.1.2 系数求解的几何意义 176

8.2 岭回归模型的应用 177

8.2.1 可视化方法确定?值 177

8.2.2 交叉验证法确定?值 179

8.2.3 模型的预测 180

8.3 LASSO回归模型 182

8.3.1 参数求解 182

8.3.2 系数求解的几何意义 183

8.4 LASSO回归模型的应用 184

8.4.1 可视化方法确定?值 184

8.4.2 交叉验证法确定?值 186

8.4.3 模型的预测 187

8.5 本章小结 189

第9章 Logistic回归分类模型 190

9.1 Logistic模型的构建 191

9.1.1 Logistic模型的参数求解 193

9.1.2 Logistic模型的参数解释 195

9.2 分类模型的评估方法 195

9.2.1 混淆矩阵 196

9.2.2 ROC曲线 197

9.2.3 K-S曲线 198

9.3 Logistic回归模型的应用 200

9.3.1 模型的构建 200

9.3.2 模型的预测 202

9.3.3 模型的评估 203

9.4 本章小结 207

第10章 决策树与森林 208

10.1 节点字段的选择 209

10.1.1 信息增益 210

10.1.2 信息增益率 212

10.1.3 基尼指数 213

10.2 决策树的剪枝 216

10.2.1 误差降低剪枝法 217

10.2.2 悲观剪枝法 217

10.2.3 代价复杂度剪枝法 219

10.3 森林 220

10.4 决策树与森林的应用 222

10.4.1 分类问题的解决 222

10.4.2 预测问题的解决 229

10.5 本章小结 231

第11章 KNN模型的应用 233

11.1 KNN算法的思想 233

11.2 k值的选择 234

你在Python数据分析的时候,是否遇到过在这些问题? 别慌!这些都是数据科入门常见问题。从入门到上手再到解决实际问题,数据科看似复杂,但如果你掌握了正确的习方法,完全可以极速入门。 【职场人进阶必备  数据分析/挖掘一点通】 如今的职场上,90%以上的岗位都会涉及数据问题。 以产品文案岗位为例,在一个新产品推向市场之前,文案需要考虑: 此时,可以关注一下市场上已有的相关产品推广数据,如:哪些文案打开率更高?哪些文案转化更好?目标用户的购买习惯如何? 以此作为下一步工作开展的依据,对产品文案工作者来说,可以少走很多弯路。 数据分析/挖掘,等于站巨人的肩膀上工作,轻松且高效。 【爬虫、数据分析数据挖掘知识点三合一】数据问题一网打尽 本课程将知识点悉数融入实战项目,不空谈语法,帮助员在实践中获取知识,目标是:让员能自主完成数据采集、数据分析数据挖掘习完本课程,你可以熟练掌握: 【实战案例超实用,轻松拥有“睡后收入”!】 本课程以股票案例为主线,串联爬虫、数据分析以及数据挖掘多个知识点。 通过实战案例演练,你可以全面掌握股票收益的分析和预判方法,在收获新技能的同时,也有机会获得“睡后收入”! 四大优势: 三重权益:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值