然后我们开始来看数据相关的概念介绍,可以看到
这里要知道,算法再厉害,得到的结果,也不会超过所提供的数据本身的限制,这一点要明确
因为数据,以及特征之间具有相关性,那么,从而增加了分析的复杂性
需要对数据进行,提纯,压缩,降维等操作,得到 小而质量高的数据,以提高预测准确性.
首先我们来看一下数据的相关性,可以看到
我们先创建数据
import numpy as np 导入数学计算包
import pandas as pd 导入数据处理包
df = pd.DataFrame(np.random.randint(0,150,size=(50,3)),columns=['Python','En