常用特征选择方法

最新推荐文章于 2024-04-15 16:57:50 发布

行者无疆_ty

最新推荐文章于 2024-04-15 16:57:50 发布

阅读量854

点赞数 2

分类专栏：人工智能文章标签：机器学习人工智能数据分析 python

本文链接：https://blog.csdn.net/a321123b/article/details/116379737

版权

本文展示了三种常用的特征选择方法：皮尔逊相关系数法、递归特征消除法、格兰杰因果检验法。
本文使用的数据集在本人上传的资源中，链接为mock_kaggle.csv

import pandas as pd
import numpy as np
import math
from matplotlib import pyplot as plt
from matplotlib.pylab import mpl
import tensorflow as tf

mpl.rcParams['font.sans-serif'] = ['SimHei']   #显示中文
mpl.rcParams['axes.unicode_minus']=False       #显示负号

取数据

data=pd.read_csv('mock_kaggle.csv',encoding ='gbk',parse_dates=['datetime'])
Date=pd.to_datetime(data.datetime)
data=data.iloc[:,1:]
datanew=data.set_index(Date)
datanew

	特价	股票	价格
datetime
2014-01-01	0	4972	1.29
2014-01-02	70	4902	1.29
2014-01-03	59	4843	1.29
2014-01-04	93	4750	1.29
2014-01-05	96	4654	1.29
...	...	...	...
2016-07-27	98	3179	2.39
2016-07-28	108	3071	2.39
2016-07-29	128	4095	2.39
2016-07-30	270	3825	2.39
2016-07-31	183	3642	2.39

937 rows × 3 columns

方法一：皮尔逊相关系数法

皮尔逊相关系数法：用于衡量两个特征的线性相关程度。值大于0，表示两个变量正相关；值小于0，表示两个变量负相关；绝对值越大表示两个变量的线性相关程度越大。值等于0只能说明两个变量不是线性相关，但有可能是其它方式的相关。

datanew.corr(method=

最低0.47元/天解锁文章

行者无疆_ty

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
3
评论
常用特征选择方法

本文展示了三种常用的特征选择方法：皮尔逊相关系数法、递归特征消除法、格兰杰因果检验法。本文使用的数据集在本人上传的资源中，链接为mock_kaggle.csvimport pandas as pdimport numpy as npimport mathfrom matplotlib import pyplot as pltfrom matplotlib.pylab import mplimport tensorflow as tfmpl.rcParams['font.sans-s
复制链接

扫一扫