皮尔逊系数对数据特征进行筛选

最新推荐文章于 2023-01-24 10:21:46 发布

coding-day

最新推荐文章于 2023-01-24 10:21:46 发布

阅读量1.8k

点赞数 2

分类专栏：机器学习算法文章标签： python

本文链接：https://blog.csdn.net/qq_29423387/article/details/119952506

版权

机器学习算法专栏收录该内容

9 篇文章 3 订阅

订阅专栏

1、输入数据：
在这里插入图片描述
type1~type48是集团的特征
type49是自己做的标签（正负样本分类）
2、代码：

#import numpy as np
import pandas as pd
#from scipy.stats import spearmanr
#from scipy.stats import pearsonr
#读取文件
df=pd.read_excel("E:\思特奇\姜鹤\移动云数据库sql文件\demo.xlsx")
#转化数据结构
df1=pd.DataFrame(df)
df2=df1[['type48','type49']]
df3=df2.corr(method='pearson')
print(df3)
# data1 = [23,20,18,29,43,35,32,40,29,26,24,26]
# data2 = [1000,1000,500,500,500,100,100,100,100,100,100,100]
# corr,p = pearsonr(data1,data2)
#print("corr为：%f" %corr,"p值为：%f" %p)