目录
前言
数据分析是通过明确分析目的,梳理并确定分析逻辑,针对性的收集、整理数据,并采用统计、挖掘技术分析,提取有用信息和展示结论的过程。
本文从常用数据分析逻辑框架及技术方法介绍出发,结合python项目实战,来全面解读数据分析。以便快速掌握数据分析的框架套路,直接上手进行数据分析。
一、 数据分析的逻辑(方法论)
1.1 PEST分析法
PEST分析是指宏观环境的分析,宏观环境是指影响一切行业或企业的各种宏观力量。P是政治(Politics),E是经济(Economy),S是社会(Society),T是技术(Technology)。通常是战略咨询顾问用来帮助企业检阅其外部宏观环境的一种方法,以吉利收购沃尔沃为例:
1.2 5W2H分析法
5W2H分析法又称七何分析法,包括:Why、What、Where、When、Who、How、How much 。主要用于用户行为分析、业务问题专题分析、营销活动等,是一个方便又实用的工具。
1.3 逻辑树分析法
逻辑树是分析问题最常用的工具之一,它是将问题的所有子问题分层罗列,从最高层开始,并逐步向下扩展。使用逻辑树分析的主要优点是保证解决问题过程的完整性,且方便将工作细分为便于操作的任务,确定各部分的优先顺序,明确地把责任落实到个人。
1.4 4P营销理论
4P即产品(Product)、价格(Price)、渠道(Place)、促销(Promotion),在营销领域,这种以市场为导向的营销组合理论,被企业应用最普遍。通过将四者的结合、协调发展,从而提高企业的市场份额,达到最终获利的目的。
4P营销理论适用于分析企业的经营状况,可视为企业内部环境,PEST分析的是企业在外部面对的环境。
1.5 SCQA分析法
SCQA分析是一个“结构化表达”工具,即S(Situation)情景、C(Complication)冲突、Q(Question)疑问、A(Answer)回答。
整个结构是通过描述当事者的现实状态,然后带出冲突和核心问题,通过结构化分析以提供更为明智的解决方案。以校园招聘SCQA分析为例:
1.6 SMART分析法
SMART法是一种目标管理方法,即对目标的S(Specific)明确性,M(Measurable)可衡量性,A(Attainable)可实现性,R(Relevant)相关性,T(Time-based)时限性。
1.7 SWOT分析法
SWOT分析法也叫态势分析法,S (Strengths)是优势、W (Weaknesses)是劣势,O (Opportunities)是机会、T (Threats)是威胁或风险。
SWOT分析法常用来确定企业自身的内部优势、劣势和外部的机会和威胁等,可以对研究对象所处的情景进行全面、系统、准确的研究,从而将公司的战略与公司内部资源、外部环境有机地结合起来。以HUAWEI 的SWOT分析为例:
二、 数据分析的技术方法
数据分析的技术方法是指提取出关键信息的具体方法,如对比分析、交叉分析、回归预测分析等方法。
2.1 对比分析法
对比分析法是将两个或两个以上的数据进行比较,分析差异,揭示发展变化情况和规律。
- 静态比较:时间一致的前提下,选取不同指标,如部门、城市、门店等,也叫横向比较。
- 动态比较:指标一致的前提下,针对不同时期的数据比较,也叫纵向比较。
举例:各车企销售表现
2.2 分组分析法
- 先经过数据加工,对数据进行数据分组,然后对分组的数据进行分析。
- 分组是为了便于对比,把总体中具有不同性质的对象区分开,把性质相同的对象合并在一起,保持各组内对象属性的一致性、组与组之间属性的差异性,以便进一步运用各种数据分析方法来解释内在的数量关系。
# 导入matplotlib和seaborn库
import matplotlib.pyplot as plt
import seaborn as sns
# 设置图形样式
sns.set(style="whitegrid")
# 创建Figure对象
fig, ax = plt.subplots(figsize=(10, 6))
# 绘制折线图
sns.lineplot(x=[1, 2, 3, 4, 5], y=[10, 8, 15, 12, 18], color="skyblue", marker="o", label="Sales")
# 添加标题和标签
plt.title("Monthly Sales", fontsize=16)
plt.xlabel("Month", fontsize=14)
plt.ylabel("Sales (million)", fontsize=14)
# 添加图例
plt.legend(loc="upper left")
# 设置x轴和y轴的刻度
plt.xticks([1, 2, 3, 4, 5], ["Jan", "Feb", "Mar", "Apr", "May"], fontsize=12)
plt.yticks(fontsize=12)
# 调整图形布局
plt.tight_layout()
# 显示图形
plt.show()