比尔·盖茨曾说过:“ChatGPT 像互联网发明一样重要,将会改变世界。”
如今 ChatGPT 已经变得非常热门,人们可以通过与 ChatGPT 进行天马行空的对话,获取自己需要的答案。它可以按照人的指令生成各种文本,来满足不同领域和场景的需求,例如翻译文本、撰写诗歌、代码、剧本、商业计划书等等。如果你实际体验过,肯定会惊叹于其强大的能力。
ChatGPT 适用于各个领域,那对于数据分析是否可行?想必也是数据分析师和与数据打交道的职场人关心的问题。虽然 ChatGPT 不是专门为数据分析而设计的工具,但是它可以对数据进行简单的分析和统计,帮助用户快速提取有效信息和数据趋,并给出建议。
我们以数据分析师职场发展路径为例,看看 ChatGPT 能做些什么,怎么做?
用 ChatGPT 预测面试题
数据分析师常见的面试问题有哪些?从技术问题和业务问题两个角度展开。
ChatGPT 收到上述内容后,返回如下结果。
数据分析师的面试通常包括技术问题和业务问题。以下是一些常见的问题。
技术问题
- 请简述描述性统计和推断性统计的区别。
- 解释假设检验及其在数据分析中的作用。
- 描述一种线性回归模型,并解释其工作原理。
- 请解释 logistic 回归模型,并介绍其在分类问题中的应用。
- 如何处理缺失数据?请举例说明。
- 请解释过拟合和欠拟合的概念,以及如何解决这些问题。
- 请简述 A/B 测试的概念,并解释如何设计和实施一个 A/B 测试。
- 描述如何使用 SQL 查询和管理数据库。
- 请简要介绍你熟悉的数据可视化工具(如 Tableau、Power BI 等),并说明其优缺点。
- 请举例说明 Python 或 R 在数据分析中的应用。
业务问题
- 请描述一个实际的数据分析项目,介绍你在项目中的角色以及分析过程。
- 请举例说明如何使用数据分析为业务决策提供支持。
- 在一个数据分析项目中,如何与非技术背景的团队成员(如销售、市场人员等)合作?
- 请描述一个你曾经遇到的棘手的数据分析问题,以及你是如何解决的。
- 当你的分析结果与业务团队的预期不符时,你会如何沟通和处理?
- 请举例说明如何根据数据分析结果为公司制定策略和提供建议。
- 在项目中,如何确定关键绩效指标(KPI)?
- 如何向不同层次的管理者或团队成员呈现分析结果?
- 当数据质量或完整性不理想时,你会如何应对?
- 请描述你在保持技能和知识更新方面所采取的措施。
准备这些问题有助于你在面试中表现出色。请注意,面试官可能会根据你的简历和具体情况提出其他问题,所以要确保对自己的简历内容和项目经验非常熟悉。同时,展示出积极的态度、良好的沟通能力和解决问题的能力,这些对于数据分析师职位同样重要。
ChatGPT 只是列出了一些比较通用的问题,我们可以问得更精确一些,如某某公司、某某行业的面试问题。发送如下内容给 ChatGPT。
BAT 大厂常见的数据分析师面试题。
ChatGPT 收到上述内容后,返回如下结果。
BAT(百度、阿里巴巴、腾讯)等大型互联网公司针对数据分析师的面试题通常涵盖了技术能力、业务理解、沟通能力和解决问题的能力等方面。以下是一些在 BAT 等大厂数据分析师面试中常见的问题。
-
在进行数据分析时,如何评估数据质量?遇到数据质量问题时如何解决?
-
解释什么是决策树算法,以及如何在数据分析中应用决策树。
-
请简要介绍聚类分析,并说明其在实际业务场景中的应用。
-
请解释 SQL 中内连接、左连接、右连接和全连接的区别,并提供示例。
-
请解释协同过滤算法,并说明如何在推荐系统中应用协同过滤。
-
请描述你在实际项目中如何应用机器学习算法解决业务问题。
-
在数据可视化中,如何根据不同需求选择合适的图表类型?
-
如何利用数据分析来评估和优化用户体验?
-
当数据量很大时,如何进行有效的数据抽样以降低计算复杂度?
-
请描述一个成功的数据分析项目,包括项目背景、目标、你的角色、分析方法和结果。
除了这些问题外,BAT 等大厂也可能会针对具体业务领域提出相关问题,例如电商、金融、广告等。因此,了解所申请公司的业务领域,并熟悉与该领域相关的数据分析方法和技术,有助于在面试中脱颖而出。
同时,在面试过程中,面试官可能会提出一些开放性问题,以评估你的思考和解决问题的能力。例如,面试官可能会给出一个实际业务问题,让你说明如何通过数据分析解决这个问题。在回答这类问题时,展现出扎实的分析技巧、业务理解能力和创造性思维非常重要。
准备这些问题并熟悉自己的简历和项目经验,能够帮助你在BAT 等大厂的数据分析师面试中取得成功。
在数据分析师的面试过程中,除了问一些比较通用的问题以及行业问题外,面试官还会基于面试者的简历内容进行提问,比如会问你简历中的某个项目是怎么做的。我们可以将简历内容发送给 ChatGPT,让它模拟面试官基于其中某段经历提出问题。比如发送如下内容给 ChatGPT。
以下是我的数据分析师求职简历中的一个专题项目,如果你是一名面试官,基于这个项目经历,你会问哪些问题?
• 项目名称:用户生命周期研究。
• 目的:研究用户在平台上的发展轨迹,并针对处于不同阶段的用户采取不同的运营策略。
• 实施:先对用户进行综合评分,根据评分划分目前用户所处的阶段,利用 k-means 算法模型发现用户在平台上的经典发展轨迹;针对不同阶段的用户触发不同类型的销售任务,从而最大化地缩短用户的进入时间、延长用户的成熟期,并对衰退期用户进行及时预警。
ChatGPT 收到上述内容后,返回如下结果。
作为一名面试官,针对你的这个项目经历,我可能会提出以下几个问题:
- 请详细介绍你确定用户综合评分的方法和依据。
- 能否具体描述你是如何使用 k-means 算法来发现用户在平台上的经典发展轨迹的?你在选择聚类数量时采用了什么策略?
- 在划分用户阶段时,你是如何确定阈值的?根据经验设定还是基于数据驱动?
- 在为不同阶段的用户触发不同类型的销售任务时,你是如何量化和评估这些运营策略的有效性的?
- 关于对衰退期用户进行及时预警,你是如何定义衰退期用户的?你采用了哪些预警指标?
- 在这个项目中,你遇到了哪些挑战和困难?你是如何克服这些困难的?
- 请介绍一下这个项目的成果及其对业务的影响,以及你在这个项目中所获得的有趣或者有启发性的洞见。
这些问题旨在了解你在这个项目中所展现的技术能力、分析思路、执行过程以及对业务的理解。希望这些建议能帮助你更好地为面试做准备。
这样一来,在面试之前就可以充分准备,做到心中有数了。
用 ChatGPT 制定 OKR
现在大多数公司引入了 OKR(objective & key result)计划,数据分析师也需要定期制订和检查自己的 OKR 计划。我们不仅可以利用 ChatGPT 辅助制订 OKR 计划,也可以让其对 OKR 计划内容进行调整、优化,还可以对 OKR 计划进行复盘。
我们可以直接让 ChatGPT 根据不同的数据分析师级别生成不同的 OKR 计划,只需发送如下内容给 ChatGPT。
帮我生成一份数据分析师的季度 OKR 计划,需要根据不同的数据分析师级别生成不同的 OKR 计划。
ChatGPT 收到上述内容后,返回如下结果。
一份数据分析师的季度 OKR 计划可以根据职位级别来调整。以下是针对初级、中级和高级数据分析师的季度 OKR 计划示例。
初级数据分析师
Objective 1:提高数据分析技能
• KR1:完成至少两门在线数据分析课程,如 SQL 和 Python 编程
• KR2:每周阅读至少一篇与数据分析相关的技术文章或博客
Objective 2:支持业务团队并优化业务流程
• KR1:及时完成每周的数据报告和分析任务,确保准确性和高质量
• KR2:与业务团队密切合作,针对业务问题提出至少 3 个数据驱动的优化建议中级数据分析师
Objective 1:提升分析效率,为业务部门提供更高质量的数据支持
• KR1:为至少两个核心业务流程开发自动化报告工具,提高报告生成效率
• KR2:深入了解业务需求,主动发现并解决至少 5 个业务关键问题
Objective 2:带领团队提高数据分析能力
• KR1:组织至少一次团队内部的数据分析技能培训或分享会
• KR2:为初级数据分析师提供指导,帮助他们完成至少 3 个关键项目
高级数据分析师
Objective 1:推动数据驱动的决策文化建设
• KR1:与高层管理团队合作,将数据驱动的决策引入至少 3 个关键业务领域
• KR2:定期与业务部门进行沟通,收集反馈并优化数据报告和分析流程
Objective 2:构建和优化数据分析基础设施
• KR1:评估现有数据分析工具和技术栈,提出至少 3 个优化建议并实施
• KR2:与数据工程团队合作,优化数据仓库结构,提高数据查询效率
请注意,这些 OKR 计划只是示例,你可以根据具体的公司和团队需求进行调整。
ChatGPT 生成的 OKR 计划无法直接使用,但是可以作为参考:数据分析师的 OKR 计划一般是什么样的,包含哪些方面。在实际工作中,我们一般有大概的 O,即大方向确定,但是不知道如何根据 O 拆解 KR,这个时候就可以让 ChatGPT 帮忙。
接下来请基于我的要求,重新生成 OKR 计划,不需要分不同级别。
O1:基础建设–完善指标体系、中间表、数据看板的构建,提高日常数据分析效率
O2:数据分析–高效、准确、及时地支持业务需求,助力业务增长。KR 主要从临时需求、A/B 实验、专题分析几个角度出发
ChatGPT 收到上述内容后,返回如下结果。
基于你的要求,以下是重新生成的数据分析师季度 OKR 计划。
Objective 1:基础建设–完善指标体系、中间表、数据看板的构建,提高日常数据分析效率
• KR1:审查和完善现有业务指标体系,确保覆盖关键业务领域
• KR2:优化现有中间表结构,提高数据处理和查询效率
• KR3:设计并构建至少 3 个新的数据看板,以满足不同业务部门的需求
Objective 2:数据分析–高效、准确、及时地支持业务需求,助力业务增长。KR 主要从临时需求、A/B 实验、专题分析几个角度出发
• KR1:及时响应临时数据分析需求,保证至少 95% 的需求在规定时间内解决
• KR2:设计并实施至少 2 个 A/B 实验,为业务优化提供数据支持
• KR3:完成至少 3 个专题分析,挖掘潜在业务增长点并提出改进策略
这些 OKR 计划可以根据具体的公司和团队需求进行调整。
这次生成的结果相对可用,在此基础上根据实际情况改一改就差不多了。
制订完 OKR 计划以后,如果觉得自己写得不够专业,可以让 ChatGPT 帮忙调整和优化。只需将所写的内容发送给 ChatGPT,让它进行修改即可。
请对下面这份数据分析师的 OKR 计划提出修改意见,并返回修改后的内容。
O1:基础建设– 持续完善业务的指标体系、中间表、数据看板的构建,提高日常数据分析效率。
• KR1:协助数据组完成数据资产的规划以及相应表的迁移、替换工作。
• KR2:梳理目前业务已有的数据资产,给数据组提出关于表的新建与重构需求。
O2:数据分析– 高效、准确、及时地支持业务需求,提出业务建议。
• KR1:日常数据归因——对日常数据异动进行准确的归因,并形成文档进行留档。
• KR2:A/B 实验评估——对平台功能的日常策略迭代进行评估,根据评估结果给出下一步实验迭代建议。
• KR3:专项分析——能够按时产出版本评估报告,并将其自动化;完成用户画像的收尾工作,并与业务团队探索初步落地方案。
ChatGPT 收到上述内容后,返回如下结果。
以下是根据你提供的 OKR 计划进行修改后的内容。
O1:基础建设–持续完善业务的指标体系、中间表、数据看板的构建,提高日常数据分析效率。
• KR1:协助数据组完成数据资产的规划,优化现有表结构,提高数据处理和查询效率。
• KR2:梳理现有业务指标体系,确保覆盖关键业务领域,并提出新的数据资产方面的需求。
• KR3:设计并构建至少 3 个新的数据看板,以满足不同业务部门的需求。
O2:数据分析–高效、准确、及时地支持业务需求,提出业务建议。
• KR1:日常数据归因——对日常数据异动进行准确归因,形成文档并存档,便于追踪和分析。
• KR2:A/B 实验评估——评估平台功能的日常策略迭代,根据评估结果提出下一步实验迭代建议。
• KR3:专项分析——按时产出版本评估报告,探索报告生成自动化;完成用户画像项目,并与业务团队协同探讨初步落地方案。
这些修改后的 OKR 计划可以根据具体的公司和团队需求进行调整。
ChatGPT 修改后的内容明显比原始版本清晰、精练很多。
在季度末,我们可以利用 ChatGPT 复盘 OKR 计划。因为 ChatGPT 具有基于上下文对话的能力,所以我们发送如下内容给 ChatGPT。
一个季度过去了,请对上述 OKR 计划进行复盘。
ChatGPT 收到上述内容后,返回如下结果。
在季度结束时,对上述 OKR 计划进行复盘。
O1:基础建设–持续完善业务的指标体系、中间表、数据看板的构建,提高日常数据分析效率
• KR1:协助数据组完成数据资产的规划,优化现有表结构,提高数据处理和查询效率。
−评估:已完成 80%,部分表结构优化尚未完成,但查询效率已显著提升。
• KR2:梳理现有业务指标体系,确保覆盖关键业务领域,并提出新的数据资产方面的需求。
−评估:已完成 100%,已梳理并优化现有指标体系,确保覆盖关键业务领域,并成功提出新的数据资产方面的需求。
• KR3:设计并构建至少 3 个新的数据看板,以满足不同业务部门的需求。
−评估:超额完成,已成功设计并构建 4 个新的数据看板,满足了不同业务部门的需求。
O2:数据分析–高效、准确、及时地支持业务需求,提出业务建议。
• KR1:日常数据归因——对日常数据异动进行准确归因,形成文档并存档,便于追踪和分析。
−评估:已完成 90%,对大部分数据异动进行了准确归因,但仍有部分案例需要进一步完善归因文档。
• KR2:A/B 实验评估——评估平台功能的日常策略迭代,根据评估结果提出下一步实验迭代建议。
−评估:已完成 95%,开展了多个 A/B 实验评估,并成功根据结果提出下一步实验迭代建议。仅有少数实验评估仍在进行中。
• KR3:专项分析——按时产出版本评估报告,探索报告生成自动化;完成用户画像项目,并与业务团队协同探讨初步落地方案。
−评估:已完成 85%,按时完成了大部分版本评估报告和报告生成自动化探索,用户画像项目也已完成,但与业务团队的初步落地方案讨论仍在进行中。
总结:整体上,本季度的 OKR 计划完成情况良好,大部分关键结果已经实现。在下个季度中,需要继续努力完成未完成的目标,并根据本季度的经验和教训,制订更切实可行的 OKR 计划。
在实际工作中,我们需要根据 OKR 计划的完成情况对上述内容进行修改,而关于一些基础术语,可以直接使用 ChatGPT 给出的结果。
至此,我们了解了在数据分析中怎么利用 ChatGPT 来更好地制订、优化和复盘 OKR 计划。
以上只是 ChatGPT 在数据分析中的部分应用,你不需要死记硬背任何一个 ChatGPT 给出的结果,只需要重点理解这些应用,并将它们灵活运用到各个领域。
更多利用 ChatGPT 进行数据分析的方法,这本书不得不读!
先人一步驾驭ChatGPT
《利用ChatGPT进行数据分析》
张俊红 | 著
10万册畅销书作者,根据 ChatGPT 在数据分析各个阶段的应用情况,按照数据分析师的职业发展路径展开,带你快速上手高效运用 ChatGPT 进行数据分析。
书中内容涉及岗位了解、技能学习、面试准备、OKR 目标制定、数据处理、数据可视化、常用数据分析方法、专题分析和 A/B 实验等。通过本书,读者将清楚地了解 ChatGPT 在数据分析领域的能力范围和实际用法。
本书导图
科学的章节设置,由浅入深,实战案例丰富,助你快速掌握 ChatGPT 在数据分析中的实用技巧。
作者简介
张俊红,某互联网公司数据分析专家,畅销书作家。
《对比Excel》系列图书作者,代表作《对比Excel,轻松学习Python数据分析》累计销量超过10万册。
喜欢分享,致力于做一个数据科学路上的终身学习者、实践者、分享者。公众号“俊红的数据分析之路”运营者。知识星球“ChatGPT与数据分析”星主。
我能读这本书吗?
如果你是,
数据分析相关从业人员,已经从事数据分析工作或具备相关经验,对利用ChatGPT 进行数据分析有浓厚的兴趣,希望进一步扩展和强化自己的技能。
应届毕业生或有意转行成为数据分析师的人员:对数据分析行业还不是很了解,希望系统地学习如何利用ChatGPT 进行数据分析,从而快速上手并提升就业竞争力。
互联网行业相关从业人员:虽然从事其他职业,比如产品运营,但工作中需要具备基础的数据分析能力。
以上人群,通通都适合这本书!
大咖推荐
数据分析是一项专业的工作。ChatGPT的出现,把专业知识变成一个字典工具,通过人机对话即可完成需求梳理、统计学的假设和验证,最后生成模型代码。这是对未来的工作模式、知识结构的变革,让我们能专注于事情本身,跨过专业知识的鸿沟。
——张丹,《R的极客理想》系列图书作者,微软MVP,北京青萌数海科技有限公司CTO
ChatGPT将极大改变数据分析的工作模式。灵活驾驭并高效使用它,将是数据分析从业者的必备技能。这本书以通俗易懂的方式介绍了数据分析的大部分工作场景与ChatGPT的使用技巧,非常适合大家入手学习。
——黄小伟,有赞数据分析负责人
如果你需要一款强大的数据分析工具,ChatGPT是目前最优的选择。它不仅能进行自然语言处理,还能分析大量数据并提供实时反馈,让你获得有价值的见解和洞察。此外,本书延续了俊红老师一贯的实践性极强的风格,做到了“即看即用”,让数据分析师可以聚焦于正确的商业问题和分析逻辑。我已经向我的团队成员推荐了这本书,也希望你能从中获取实用的知识和灵感启示。
——徐小磊,商业分析总监,畅销书《运营之路》作者
数据分析工具,从原始算盘到Excel、MATLAB、SAS、Lingo、EViews、SPSS、Python等,经历了很多轮升级,现在ChatGPT又提供了全新的体验。俊红老师的这本书,拆分了数据分析的工作场景,从数据处理、分析方法、可视化等多个角度,介绍了ChatGPT如何在其中发挥作用,可谓掌握这一新工具的最佳手册。新工具会带来新的工作方式,而善于使用新工具的人能创造更多价值。数据分析师们都可以学起来、用起来!
——接地气的陈老师
俊红的书让我眼前一亮。狂飙突进的大模型在各行各业都引起了热议与焦虑。然而不管如何运用大模型的生成能力,对传统的生产流程进行改造已是不可逆的趋势。本书详尽地演示了如何运用大模型为数据分析工作提效,值得所有愿意拥抱新技术的数据分析师一读。
——刘凡,美团到综数据智能团队负责人
2023年初,ChatGPT的火热让AIGC技术拥有了一个极端友好的playground,令所有人兴奋的爆点就这么出现了。我们知道,新的生产工具一定会带来新的生产关系,最终引发产业结构的变化,总的来说这是件大好事。可是与此同时,不少新人朋友也提出了“数据分析师是否会被取代”的问题。俊红的这本书从实际应用的视角给出了明确的答案,并且提供了一个很好的拥抱新技术的方式。
——陈文思,美团数据产品经理,《写给数据产品经理新人的工作笔记》作者
除了在业界多个大厂拥有丰富的数据分析从业经验,俊红更是一位久经考验的数据分析布道者,能够以简单易懂的语言阐明复杂的分析方法。在ChatGPT“大行其道”的今天,俊红更是敢为人先,通过自己的实践摸索出如何高效使用ChatGPT提高数据分析能力的方法论。我相信这本书会给所有工作中需要用到数据分析的朋友带来很好的启发。
——王震宇,某互联网大厂用户增长数据科学团队负责人
ChatGPT当属2023年上半年科技领域最热关键词,这项新工具的出现让人们意识到技术革新势不可挡。当人工智能的未来已来,作为数据分析师的我们唯有更好地拥抱新技术,才能开辟新的生存之道,而这本书恰好提供了这样一种思路,从认识、理解及掌握ChatGPT的数据分析能力出发,将ChatGPT转化为提高我们工作效率的工具,让ChatGPT更好地为数据分析师洞悉本质的智慧服务,成为未来数据分析领域的领路人。
——丁芬,某互联网大厂数据科学家