在开始数据分析之前,提出正确的问题和/或理解问题至关重要。以下是在深入分析之前需要提出的20个问题的列表:
- 谁将使用分析结果的受众?(董事会成员,销售人员,客户,员工等)
- 如何使用结果?(做出业务决策,投资产品类别,与供应商合作,识别风险等)
- 观众对我们的分析有什么问题?(能够过滤关键细分,跨时间查看数据以识别趋势,深入细节等)
- 如何优先考虑问题以获得最大价值?
- 确定关键利益相关者并获得他们对有趣问题的意见
- 谁应该能够访问这些信息?考虑保密/安全问题
- 谁将开发和维护报告?
- 每份报告都有哪些信息?
- 目前以另一种格式存在哪些报告?现有报告可能会有哪些变化?
- 需要开发哪些ETL或存储过程?
- 满足报告要求需要哪些数据库增强功能?
- 每份报告何时交付?
- 数据所需的更新频率是多少?确保货币
- 哪些数据源可供使用?
- 我是否具有访问分析所需数据所需的权限或凭据?
- 每个数据集的大小是多少,我需要从每个数据集中获取多少数据?
- 我对每个数据库中的基础表和模式有多熟悉?我是否需要与其他任何人一起理解数据结构
- 我是否需要所有数据进行更细粒度的分析,还是需要一个子集以确保更快的性能?
- 由于差异,数据是否需要标准化?
- 我是否需要分析来自外部来源的数据,这些数据位于我组织的数据之外?
原文:https://towardsdatascience.com/20-questions-to-ask-prior-to-starting-data-analysis-6ec11d6a504b