作者 | gongyouliu
编辑 | auroral-L
大家好,我是强哥。一个热爱暴走、读书、写作的人!
Google在2004年发布了划时代意义的论文《MapReduce:Simplified Data Processing on Large Clusters》,这标志着大数据时代的到来。基于这篇论文思想的开源实现——Hadoop在2008年正式成为Apache基金会下的顶级项目,这一事件影响巨大,从今往后任何个人和组织都可以免费获得大数据处理能力了。过去十几年,大数据从萌芽到成熟,经历了一个快速的爆发增长过程。可以说,现在人人都知道大数据了,我们早已进入大数据时代。
我最早是从2012年开始接触大数据的,也算是国内最早的一批做大数据的人,自己参与并见证了大数据的发展、壮大、成熟。过去近十年我一直亲身参与或者领导大数据分析相关的工作,趟过了很多坑,也积累了丰富的经验。
谈到大数据,离不开数据分析技术。数据分析不是一个新的技术或者职业,甚至在计算机出现之前就有了。但是在大数据时代,数据分析不可避免地受到大数据思维的影响和塑造。毫不夸张地说,正是大数据让数据分析从一个偏冷门的方向蜕变为当今红极一时的热门职业。
在当前互联网流量增长见顶的时代,企业要想在激烈的竞争中生存下来,利用数据思维进行运营决策是非常重要的,能够深刻认识到数据思维的价值并且努力践行的公司才能够更好地生存下来。越来越多的企业将数据分析和数据化运营作为核心能力,这带动了数据分析职位的爆发增长。在过去短短几年内,我们见证了数据分析师从供不应求到目前的供过于求的局面,可见大数据对数据分析行业的影响是多么的巨大。
(大)数据分析经过十来年的发展,已经很成熟了,市面上这方面的人才也非常多,相关的学习材料、书籍多如牛毛。但是真正在行业中做过6年以上数据分析的人少之又少,很多学习材料也不够系统,出版物鱼龙混杂、参差不齐。因此,作为有着近10年数据分析实践经验的人,我还是想将我过去这么多年的经验梳理一遍,汇聚成一本比较系统、专业的数据分析入门书籍,为整个大数据时代的发展贡献自己微薄的一点力量。
做这个决定是艰难的。首先我要确保我写的东西跟市面上的书籍有差异点,否则再写一本也没有什么意义。另外,我平时很忙,也正在写两本推荐系统相关的书籍,时间是非常有限的。差异性我觉得可以得到保证,我会基于自己对数据分析的整体思路及核心能力展开,梳理自己十来年的经验总结和思考感悟,这肯定是跟别人的不一样的。时间上,我觉得如果制定一个比较合理的时间计划也不是不可能的。最终经常仔细的思考、决策、规划,我鼓足勇气准备开始写一本数据分析的入门书籍。这本书的书名我暂定为《从零入门数据分析:思维、方法与案例分析》。
我的计划是从现在开始花2年时间(从2021年10月底到2023年3月中旬)连载25篇数据分析相关相关的文章,这些文章就是这本数据分析入门书的初稿。等连载完文章,就将这些文章整理出书。希望这本书最终可以在2023年底或者2024年初跟大家见面,下面我对这个连载出书计划进行简单说明。
一、这本书的特色及实用人群
这本书是数据分析的入门书,覆盖数据分析全生命周期中的各种思维、方法、策略,并且会包含代码和实际案例,也包括很多高级的数据分析技能,期望这本书可以帮助大家从零入门数据分析。这本书的主要特色有如下4点:
1. 涵盖数据分析所需的核心技能和方法
2. 从业务角度讲解,包括业务思维、代码、案例等
3. 包含很多高阶的数据分析方法
4. 基于自己多年经验对数据分析的思考、感悟
这本书主要是方便对数据分析、数据挖掘、数据科学感兴趣,想了解学习数据分析思维和方法的读者,适用人群主要有:
1. 想了数据分析基础技能和思维方法的学生、从业者
2. 想从事数据分析工作的学生、在职人员
3. 对数据分析感兴趣的产品、运营、市场人员
4. 想将数据分析能力整合到产品中的管理人员
二、这本书的大纲
这本书分为6大部分,包括:背景介绍、基础技能、业务分析、高阶技能、思维方法、机遇与挑战等内容。内容是非常全面的,覆盖了数据分析基础知识、思维方式、方法技巧、业务分析能力等重要知识点,具体大纲可以参考下面脑图。
三、这本书的写作出版计划
我写这本书的策略是将这件事当成一个项目来做,先整理好书的大纲。然后按照大纲顺序写,每一章写一篇文章,每篇文章花3周时间,文章写完后先发布在公众号。按照这种方式执行,这个工程就拆解为一个个小目标了,这样更容易检验、也方便跟进。文章发布在公众号后,我也会收集大家的反馈信息,这些信息可以帮助我在出书过程进行优化完善。
这本书是入门书,包含25章,按照每章5000到8000字算,大致是12.5万到29万字之间。如果出版成书,大概是200到250页左右。
我计划3周左右写一篇,那么写完25篇文章大概需要75周时间,不到2年时间。如果从今年10月27日发第一篇算起,需要写到2023年3月15日(大家可以参考下面的时间表来看具体每一章的发布时间)。写完初稿后,2023年剩下的几个月就用于出书过程中的修改、调整、审核等其他与出版相关的工作。最终书应该会在2023年底或者2024年初印刷出来。
篇 | 章 | 发布时间 |
第一篇:背景介绍篇 | 第01章:数据分析概述 | 2021.10.27 |
第02章:数据分析必备技能 | 2021.11.17 | |
第03章:大数据时代下的数据分析 | 2021.12.08 | |
第04章:数据分析与数据化运营 | 2021.12.29 | |
第05章:数据分析团队介绍 | 2022.01.19 | |
第二篇:基础技能篇 | 第06章:数据埋点与数据收集 | 2022.02.09 |
第07章:数据预处理 | 2022.03.02 | |
第08章:数据存储、数据仓库与数据湖 | 2022.03.23 | |
第09章:数据指标体系 | 2022.04.13 | |
第10章:数据分析工具 | 2022.05.04 | |
第11章:数据可视化技术 | 2022.05.25 | |
第三篇:业务分析篇 | 第12章:留存分析 | 2022.06.15 |
第13章:漏斗分析 | 2022.07.06 | |
第14章:归因分析 | 2022.07.27 | |
第15章:路径分析 | 2022.08.17 | |
第16章:分布分析 | 2022.09.07 | |
第四篇:高阶技能篇 | 第17章:购物篮分析 | 2022.09.28 |
第18章:聚类分析 | 2022.10.19 | |
第19章:分类分析 | 2022.11.09 | |
第20章:回归分析 | 2022.11.30 | |
第21章:时间序列分析 | 2022.12.21 | |
第五篇:思维方法篇 | 第22章:数据分析思维介绍 | 2023.01.11 |
第23章:数据分析师的工作流程 | 2023.02.01 | |
第24章:数据分析的目标与价值 | 2023.02.22 | |
第六篇:结尾篇 | 第25章:数据分析师的机遇与挑战 | 2023.03.15 |
写这篇文章算是对外宣布了这个写作计划,也是给自己立了一个flag,希望自己在接下来的2年时间里努力输出,完成这个系列的文章并最终将书出版。也希望读者可以跟随这个系列一起学习成长,让我们一起见证这本数据分析入门著作的诞生!