【粉丝福利社】 SQL数据分析实战(第2版)(文末送书-进行中)

在这里插入图片描述

🏆 作者简介,愚公搬代码
🏆《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,51CTO博客专家等。
🏆《近期荣誉》:2023年华为云十佳博主,2022年CSDN博客之星TOP2,2022年华为云十佳博主等。
🏆《博客内容》:.NET、Java、Python、Go、Node、前端、IOS、Android、鸿蒙、Linux、物联网、网络安全、大数据、人工智能、U3D游戏、小程序等相关领域知识。
🏆🎉欢迎 👍点赞✍评论⭐收藏


🚀前言

SQL数据分析实战是指利用结构化查询语言(SQL)对数据库中的数据进行分析、查询、处理和可视化的实际操作过程。这种实战活动旨在通过实际应用SQL语言来解决真实世界的数据分析问题,以从数据中提取有用的信息、发现模式和趋势,支持决策制定和业务优化。

SQL数据分析实战通常包括以下几个步骤:

  1. 数据理解与准备:首先理解数据的来源和含义,确定分析的目标和问题,然后进行数据收集、清洗、整理和准备,以确保数据的质量和可用性。

  2. SQL查询和分析:利用SQL语言编写查询语句,从数据库中提取需要的数据,进行各种分析操作,包括数据筛选、排序、分组、聚合、连接等,以获取所需的分析结果。

  3. 数据可视化:将分析结果通过图表、报表等形式进行可视化展示,以便更直观地理解数据的含义和发现数据之间的关系,支持决策和沟通。

  4. 模型建立与预测:在一些情况下,可以基于SQL数据分析的结果建立数据模型,进行预测和优化,以帮助解决业务问题或优化业务流程。

  5. 结果解释与报告:对分析结果进行解释和总结,撰写分析报告,向相关利益相关者传达分析结论和建议,支持决策制定和业务改进。

SQL数据分析实战可以应用于各种领域,包括但不限于市场营销分析、销售业绩分析、客户行为分析、财务分析、供应链分析等。通过实际操作SQL语言进行数据分析,可以提高数据分析能力,深入理解数据,发现潜在商机和问题,并为业务决策提供有力支持。

🚀一、SQL数据分析实战(第2版)

本文送出的书籍是这本:

在这里插入图片描述

🔎1.编辑推荐

《SQL数据分析实战(第2版)》由一个专业数据科学家团队撰写,该团队曾经利用自己的数据分析技能为各种形式和规模的企业提供服务,因此拥有非常丰富的实践经验。本书是读者开始学习数据分析的入门宝典,它向读者展示了如何有效地筛选和处理来自原始数据的信息。即使你是一个没有任何经验的新人,也可以从本书的学习中获益良多。

🔎2.内容简介

《SQL数据分析实战(第2版)》详细阐述了与SQL数据分析相关的基本解决方案,主要包括SQL数据分析导论、SQL和数据准备、聚合和窗口函数、导入和导出数据、使用复合数据类型进行分析、高性能SQL、科学方法和应用问题求解等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。

🔎3.产品特色

在这里插入图片描述

🔎4.目录

1章 SQL数据分析导论 1

1.1 本章主题简介 1

1.2 数据世界 2

1.2.1 数据类型 2

1.2.2 数据分析和统计 3

1.2.3 统计类型 3

1.2.4 作业1.01:分类新数据集 4

1.3 描述性统计方法 5

1.3.1 单变量分析 5

1.3.2 数据频率分布 6

1.3.3 练习1.01:创建直方图 6

1.3.4 分位数 11

1.3.5 练习1.02:计算附加销售额的四分位数 12

1.3.6 集中趋势的度量 15

1.3.7 练习1.03:计算附加销售额的集中趋势 16

1.3.8 数据散布的度量 17

1.3.9 练习1.04:附加销售额的散布程度 19

1.3.10 双变量分析 20

1.3.11 散点图 20

1.3.12 皮尔逊相关系数 24

1.3.13 练习1.05:计算两个变量的Pearson相关系数 25

1.3.14 解释和分析相关系数 28

1.3.15 时间序列数据 30

1.3.16 作业1.02:探索经销商销售数据 31

1.3.17 处理缺失数据 32

1.4 统计显著性检验 32

1.4.1 统计显著性检验的组成 32

1.4.2 常见的统计显著性检验 34

1.5 关系数据库和SQL 34

1.5.1 关系数据库的基础概念 34

1.5.2 SQL数据库的优缺点 35

1.6 SQL的基本数据类型 36

1.6.1 数值 36

1.6.2 字符 37

1.6.3 布尔值 37

1.6.4 日期时间值 38

1.6.5 数据结构:JSON和数组 38

1.7 读取表:SELECT查询 38

1.7.1 SELECT查询的工作原理 39

1.7.2 SELECT查询中的基本关键字 40

1.7.3 SELECT和FROM语句 40

1.7.4 WHERE 子句 41

1.7.5 AND/OR子句 41

1.7.6 IN/NOT IN子句 42

1.7.7 ORDER BY子句 43

1.7.8 LIMIT子句 45

1.7.9 IS NULL/IS NOT NULL子句 46

1.7.10 练习1.06:在SELECT查询中使用基本关键字 47

1.7.11 作业1.03:在SELECT查询中使用基本关键字查询客户表 49

1.8 创建表 49

1.8.1 创建空白表 49

1.8.2 列约束 50

1.8.3 练习1.07:在SQL中创建表 50

1.8.4 使用SELECT创建表 51

1.9 更新表 52

1.9.1 添加和删除列 52

1.9.2 添加新数据 53

1.9.3 更新现有行 55

1.9.4 练习1.08:更新表格以提高车辆的价格 56

1.10 删除数据和表 57

1.10.1 从行中删除值 57

1.10.2 从表中删除行 58

1.10.3 删除表 59

1.10.4 练习1.09:删除不必要的表 59

1.10.5 作业1.04:为营销活动创建和修改表 60

1.11 SQL和分析 61

1.12 小结 612章 SQL和数据准备 63

2.1 本章主题简介 63

2.2 组合数据 63

2.2.1 使用JOIN连接表 64

2.2.2 连接类型 66

2.2.3 内连接 67

2.2.4 外连接 70

2.2.5 交叉连接 75

2.2.6 练习2.01:使用JOIN进行分析 76

2.2.7 子查询 77

2.2.8 UNION 78

2.2.9 练习2.02:使用UNION生成来宾名单 80

2.2.10 公用表表达式 82

2.3 转换数据 83

2.3.1 CASE WHEN函数 84

2.3.2 练习2.03:使用CASE WHEN函数获取区域列表 85

2.3.3 COALESCE函数 86

2.3.4 NULLIF函数 87

2.3.5 LEAST和GREATEST函数 89

2.3.6 转换函数 90

2.3.7 DISTINCT和DISTINCT ON函数 91

2.3.8 作业2.01:使用SQL技术构建销售模型 93

2.4 小结 943章 聚合和窗口函数 95

3.1 本章主题简介 95

3.2 聚合函数 95

3.2.1 常见聚合函数简介 96

3.2.2 练习3.01:使用聚合函数分析数据 98

3.3 使用GROUP BY聚合函数 99

3.3.1 GROUP BY子句 100

3.3.2 多列GROUP BY 104

3.3.3 练习3.02:使用GROUP BY按产品类型计算成本 105

3.3.4 分组集 106

3.3.5 有序集合聚合 107

3.4 HAVING子句 109

3.4.1 HAVING子句的语法 109

3.4.2 练习3.03:使用HAVING子句计算并显示数据 110

3.5 使用聚合函数清洗数据和检查数据质量 111

3.5.1 使用GROUP BY查找缺失值 111

3.5.2 使用聚合函数衡量数据质量 113

3.5.3 作业3.01:使用聚合函数分析销售数据 114

3.6 窗口函数 115

3.6.1 窗口函数基础知识 116

3.6.2 练习3.04:分析一段时间内的客户数据填充率 121

3.6.3 WINDOW关键字 123

3.7 窗口函数统计 124

3.7.1 练习3.05:雇佣日期的排名顺序 125

3.7.2 窗口frame子句 126

3.7.3 练习3.06:团队午餐激励 129

3.7.4 作业3.02:使用窗口帧和窗口函数分析销售数据 130

3.8 小结 1314章 导入和导出数据 133

4.1 本章主题简介 133

4.2 COPY命令 134

4.2.1 使用psql复制数据 135

4.2.2 配置COPY和 \copy 137

4.2.3 使用COPY和\copy将数据批量上传到数据库 138

4.2.4 练习4.01:将数据导出到文件以在Excel中进一步处理 139

4.3 使用R分析数据 143

4.3.1 使用R的原因 143

4.3.2 开始使用R 143

4.4 使用Python分析数据 146

4.4.1 使用Python的原因 146

4.4.2 开始使用Python 146

4.4.3 使用SQLAlchemyPandas改进Python中的Postgres访问 149

4.4.4 关于SQLAlchemy 150

4.4.5 结合使用PythonJupyter Notebook 151

4.4.6 使用Pandas读写数据库 153

4.4.7 练习4.02:在Python中读取和可视化数据 154

4.4.8 使用Python将数据写入数据库 156

4.4.9 使用COPY提高Python写入速度 157

4.4.10Python读写CSV文件 158

4.5 导入和导出数据的最佳实践 160

4.5.1 跳过密码 160

4.5.2 作业4.01:使用外部数据集发现销售趋势 161

4.6 小结 1625章 使用复合数据类型进行分析 163

5.1 本章主题简介 163

5.2 用于分析的日期和时间数据类型 164

5.2.1 关于DATE类型 164

5.2.2 转换日期类型 167

5.2.3 关于INTERVAL类型 169

5.2.4 练习5.01:时间序列数据分析 170

5.3PostgreSQL中执行地理空间分析 172

5.3.1 纬度和经度 172

5.3.2PostgreSQL中表示纬度和经度 172

5.3.3 练习5.02:地理空间分析 174

5.4PostgreSQL中使用数组数据类型 176

5.4.1 关于ARRAY类型 176

5.4.2 练习5.03:使用数组分析序列 179

5.5PostgreSQL中使用JSON数据类型 181

5.5.1 JSONB:预解析的JSON 183

5.5.2 从JSON或JSONB字段访问数据 184

5.5.3 使用JSON路径语言 186

5.5.4 在JSONB字段中创建和修改数据 188

5.5.5 练习5.04:通过JSONB搜索 189

5.6 使用PostgreSQL的文本分析 191

5.6.1 标记文本 191

5.6.2 练习5.05:执行文本分析 193

5.6.3 执行文本搜索 196

5.6.4 优化PostgreSQL上的文本搜索 198

5.6.5 作业5.01:销售搜索和分析 200

5.7 小结 2026章 高性能SQL 203

6.1 本章主题简介 203

6.2 数据库扫描方法 204

6.2.1 查询计划 205

6.2.2 顺序扫描 205

6.2.3 练习6.01:解释查询计划器 206

6.2.4 作业6.01:查询计划 210

6.2.5 索引扫描 211

6.2.6 B树索引 212

6.2.7 练习6.02:创建索引扫描 213

6.2.8 作业6.02:实现索引扫描 218

6.2.9 哈希索引 219

6.2.10 练习6.03:生成若干个哈希索引来比较性能 220

6.2.11 作业6.03:实现哈希索引 223

6.2.12 有效的索引使用 224

6.3 高性能JOIN 226

6.3.1 练习6.04:使用INNER JOIN 227

6.3.2 作业6.04:实现高性能连接 233

6.4 函数和触发器 234

6.4.1 函数定义 235

6.4.2 练习6.05:创建没有参数的函数 236

6.4.3 作业6.05:定义最大销售额函数 239

6.4.4 练习6.06:创建带参数的函数 240

6.4.5 关于\df和\sf命令 241

6.4.6 作业6.06:创建带参数的函数 242

6.4.7 触发器 243

6.4.8 练习6.07:创建触发器来更新字段 245

6.4.9 作业6.07:创建触发器以跟踪平均购买量 250

6.4.10 终止查询 251

6.4.11 练习6.08:取消长时间运行的查询 252

6.4.12 作业6.08:终止长时间运行的查询 253

6.5 小结 2547章 科学方法和应用问题求解 255

7.1 本章主题简介 255

7.2 案例分析 255

7.2.1 科学方法 256

7.2.2 练习7.01:使用SQL技术进行初步数据收集 256

7.2.3 练习7.02:提取销售信息 259

7.2.4 作业7.01:量化销量下降的情况 263

7.2.5 练习7.03:启动时序分析 265

7.2.6 作业7.02:分析销售价格假设的差异 272

7.2.7 练习7.04:通过电子邮件打开率分析销量增长情况 274

7.2.8 练习7.05:分析电子邮件营销活动的效果 282

7.2.9 得出结论 286

7.2.10 现场测试 286

7.3 小结 287

附录 289

·XXX·

SQL数据分析实战(第2版)

·XXXI·

目 录

🔎5.赠书活动

  • 🎁本次送书1~2本,【取决于阅读量,阅读量越多,送的越多】👈
  • ⌛️活动时间:阅读量满足3000
  • ✳️参与方式:关注博主+三连(点赞、收藏、评论),评论语:我要《SQL数据分析实战(第2版)》

需要完全了解本书可以看下面:

🚀二、中奖名单

用户昵称本数达成日期
应粉丝要求保密

🚀感谢:给读者的一封信

亲爱的读者,

我在这篇文章中投入了大量的心血和时间,希望为您提供有价值的内容。这篇文章包含了深入的研究和个人经验,我相信这些信息对您非常有帮助。

如果您觉得这篇文章对您有所帮助,我诚恳地请求您考虑赞赏1元钱的支持。这个金额不会对您的财务状况造成负担,但它会对我继续创作高质量的内容产生积极的影响。

我之所以写这篇文章,是因为我热爱分享有用的知识和见解。您的支持将帮助我继续这个使命,也鼓励我花更多的时间和精力创作更多有价值的内容。

如果您愿意支持我的创作,请扫描下面二维码,您的支持将不胜感激。同时,如果您有任何反馈或建议,也欢迎与我分享。

在这里插入图片描述

再次感谢您的阅读和支持!

最诚挚的问候, “愚公搬代码”

  • 30
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 5
    评论
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

愚公搬代码

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值