机器学习笔记 - 探索性数据分析(EDA) 概念理解

        了解您需要了解的有关探索性数据分析的所有信息,探索性数据分析是一种用于分析和汇总数据集的方法

一、什么是探索性数据分析?

        数据科学家使用探索性数据分析 (Exploratory Data Analysis) 来分析和调查数据集并总结其主要特征,通常采用数据可视化方法。它有助于确定如何最好地操纵数据源以获得所需的答案,从而使数据科学家更容易发现模式、发现异常、检验假设或检查假设。

        EDA 主要用于查看在正式建模或假设检验任务之外可以揭示哪些数据,并提供对数据集变量及其之间关系的更好理解。它还可以帮助确定您正在考虑用于数据分析的统计技术是否合适。EDA 技术最初由美国数学家 John Tukey 在 1970 年代开发,在今天的数据发现过程中仍然是一种广泛使用的方法。

二、为什么探索性数据分析在数据科学中很重要?

        EDA 的主要目的是帮助在做出任何假设之前查看数据。它可以帮助识别明显的错误,更好地理解

  • 3
    点赞
  • 57
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
探索性数据分析(Exploratory Data Analysis,简称EDA)和机器学习之间有密切的联系。 EDA是一种数据分析的方法,旨在通过可视化和统计技术来理解数据集的特征、结构和模式。它帮助我们发现数据中的异常值、缺失值、相关性和趋势等信息,以便为后续的分析和决策提供基础。 机器学习是一种使用算法和模型来让计算机从数据中学习并进行预测或决策的方法。它依赖于输入数据的质量和特征选择等因素,而这些因素可以通过EDA来帮助我们理解和准备数据。 具体来说,EDA可以帮助我们进行以下几个方面的工作: 1. 数据预处理:通过EDA,我们可以检查数据中的缺失值、异常值和重复值等问题,并决定如何处理它们。这对于后续的机器学习任务非常重要,因为模型对于干净、一致和完整的数据更容易学习。 2. 特征工程:EDA可以帮助我们发现数据中的相关性、趋势和模式等特征。这些洞察可以用于选择和构建有助于机器学习任务的特征。通过合理选择特征,可以改善模型的性能和效果。 3. 数据可视化:EDA通过可视化技术,如直方图、散点图和箱线图等,可以帮助我们直观地理解数据的分布、关系和变化趋势。这有助于我们发现数据中的规律和异常情况,并为机器学习任务提供直观的参考。 总之,EDA提供了数据分析的基础,为机器学习任务提供了数据准备和特征选择的依据,可以帮助我们更好地理解数据并优化机器学习模型的性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值