人工智能_机器学习094_数据相关性概念_数据相关性计算方法_皮尔逊相关系数_计算数据相关性作用_数据提纯数据质量_决定算法精确性_代码演示---人工智能工作笔记0134

本文介绍了数据相关性的概念,并通过Python的Pandas库展示了如何计算数据的相关性,特别是皮尔逊相关系数。通过示例说明了如何生成具有相关性的数据,并解释了相关性矩阵中的值的含义,强调了理解数据相关性在减少特征冗余和提高算法精度中的作用。
摘要由CSDN通过智能技术生成

然后我们开始来看数据相关的概念介绍,可以看到

这里要知道,算法再厉害,得到的结果,也不会超过所提供的数据本身的限制,这一点要明确

因为数据,以及特征之间具有相关性,那么,从而增加了分析的复杂性

需要对数据进行,提纯,压缩,降维等操作,得到 小而质量高的数据,以提高预测准确性.

首先我们来看一下数据的相关性,可以看到

我们先创建数据

import numpy as np 导入数学计算包

import pandas as pd 导入数据处理包

df = pd.DataFrame(np.random.randint(0,150,size=(50,3)),columns=['Python','En

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

添柴程序猿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值