特征工程
文章平均质量分 83
alstonlou
这个作者很懒,什么都没留下…
展开
-
时序数据分解
时序数据作为与时间强相关数据,有着独特的特点,但是也有很多通用的数据的性质。原创 2024-04-09 09:15:52 · 1092 阅读 · 0 评论 -
特征工程-特征处理(三)
PCAPCA是一种常见的数据分析方式,通过数据分解,将高维数据降低为低维数据,同时最大程度保持数据中保存的信息。LDALDA是另一种常见的数据分解方法,与PCA不同的是,LDA算法的思想是将数据投影到低维空间之后,使得同一类数据尽可能的紧凑,在低维空间中保持紧凑。Filter:相关系数:通过计算特征时间的相关系数,根据需要,去除冗余特征数据。卡方检验:通过假设检验,计算卡方值,判断是否接受原假设,留下当前特征。信息增益:计算加入各个特征的信息增益,来确定是否需要加入该特征。原创 2024-01-16 21:03:10 · 758 阅读 · 0 评论 -
特征工程-特征处理(二)
将原本的具体时间拆分为年月日等多个特征变量,同时可以引入在一天的某个时间段,或者是当天是否为节假日等其他条件,还可以进一步结合其他特征,进行前后一个时间段或是多个时间段时间的特征差值。原创 2024-01-15 19:29:04 · 575 阅读 · 0 评论 -
特征工程-特征处理(一)
完成特征理解和特征清洗之后,我们要进行特征工程中最为重要和复杂的一步了——特征处理。原创 2024-01-13 09:12:07 · 585 阅读 · 0 评论 -
特征工程-特征清洗
在进行玩特征理解后,我们大致理解了面对的数据中包含哪些内容。下一阶段,我么需要对数据中的内容进行进一步分析处理,针对不同数据进行清洗。数据清洗是对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。原创 2024-01-11 20:04:00 · 1348 阅读 · 0 评论 -
特征工程(二)
理解手上的数据,就可以更好的明确下一步的方向。我们从理解最基础的数据结构入手,然后研究不同的数据类型。在理解数据后,就可以开始修正有问题的数据了。例如,我们必须知道数据中有多少缺失值,以及如何处理。原创 2024-01-10 18:02:43 · 419 阅读 · 0 评论 -
特征工程-数据准确性
在当今的大数据时代,数据以及成为企业和组织中最宝贵的资源之一。通过人工智能和机器学习的应用,能够从数据中深度挖掘出相关信息并进行应用。然而,智能数据分析的准确性依赖于数据质量,因此,数据质量的关键性成为了一个重点关注的问题。在下面,我们将探讨数据质量的关键性以及如何确保智能数据分析的准确性。原创 2024-01-09 10:41:48 · 1618 阅读 · 0 评论 -
特征工程(一)
简单来讲将数据转换为能更好地表示潜在问题的特征,从而提高机器学习性能。原创 2024-01-08 22:00:12 · 659 阅读 · 0 评论