数据分析涉及检查、转换和排列数据,以便可以对数据进行研究和提取有用的信息。 数据分析是一种涵盖整个数据管理任务范围的学科。 这些任务不仅包括分析,还包括数据收集、组织、存储以及所使用的所有工具和技术。
术语“数据分析”是一种笼统术语,涵盖一系列活动,其中每个活动都具有自己的焦点和目标。 可以将这些活动归类为描述性、诊断、预测、规范性和认知分析。
在本单元中,你将了解这些类别的数据分析。
描述性分析
描述性分析有助于根据历史数据回答有关发生了什么的问题。 描述性分析技术汇总了大型数据集,向利益干系人描述结果。
通过开发 KPI(关键绩效指标),这些策略有助于跟踪关键目标的成功或失败情况。 许多行业中都使用指标,例如投资回报率 (ROI)。 开发专门的指标来跟踪特定行业的绩效。
描述性分析的示例包括生成报表来提供组织销售和财务数据的视图。
诊断分析
诊断分析有助于回答有关事件发生原因的问题。 诊断分析技术补充更基本的描述性分析。 它们从描述性分析中提取结果,并更深入挖掘查找原因。 进一步调查绩效指标来发现它们变得更好或更糟的原因。 这通常分为三个步骤:
- 确定数据中的异常。 这可能是指标或特定市场中的意外更改。
- 收集与这些异常相关的数据。
- 使用统计技术来发现用以解释这些异常的关系和趋势。
预测分析
预测分析有助于回答有关将来会发生什么的问题。 预测分析技术使用历史数据来确定趋势并确定它们是否有可能重复出现。 预测分析工具提供将来可能发生什么的有价值见解。 技术包括各种统计和机器学习技术,例如神经网络、决策树和回归。
规范性分析
规范性分析有助于回答应采取哪些措施来实现目标的问题。 通过使用来自预测分析的见解,可进行数据驱动的决策。 此方法允许企业在面临不确定性时做出明智的决策。 规范性分析技术依赖机器学习策略来找出大型数据集中的模式。 通过分析过去的决策和事件,可以估计不同结果的可能性。
认知分析
认知分析尝试从现有数据和模式中进行推断,并基于现有知识库得出结论,然后将这些结果添加回知识库,以供将来进行推断,这是一个自学习反馈循环。 认知分析有助于了解如果情况发生变化可能发生什么,以及如何处理这些情况。
推断不是基于规则数据库的结构化查询,而是从一些源收集的非结构化假设,并以不同的置信度表示。 有效认知分析取决于机器学习算法。 它使用数个 NLP(自然语言处理)概念来了解以前未使用的数据源,例如呼叫中心对话日志和产品评论。
从理论上讲,通过利用大规模并行/分布式计算的优势以及数据存储和计算能力不断下降的成本,这些系统可以实现的认知开发不受限制。