金融数据2

最新推荐文章于 2022-04-01 12:54:18 发布

haisong chen

最新推荐文章于 2022-04-01 12:54:18 发布

阅读量415

点赞数

文章标签：数据挖掘

本文链接：https://blog.csdn.net/chen19830/article/details/88090538

版权

本文介绍了金融数据中进行特征筛选的三种方法：通过相关性分析选取与目标变量'status'最相关的10个特征；利用随机森林筛选出49个重要特征；以及基于IV值进行特征选择。内容为初学者的学习心得，参考了相关博客资源。

摘要由CSDN通过智能技术生成

数据特征筛选

通过相关性

corrmat = X.corr()
f,ax = plt.subplots(figsize=(12, 9))
sns.heatmap(corrmat, square=True)

从这里可以发现每个特征彼此之间的相关性。

k = 10
f, ax = plt.subplots(figsize=(12, 9))
cols = corrmat.nlargest(k, 'status').index
data = X[cols]
cm = pd.DataFrame(data).corr()
sns.set(font_scale=1.25)
hm = sns.heatmap(cm, cbar=True, square=True, annot=True, fmt='.2f', annot_kws={'size':10}, yticklabels=cols.values, xticklabels=cols.values)
plt.show()

在这里插入图片描述
这里我选取了与‘status’最相关的10个特征

通过随机森林筛选特征

from sklearn.ensemble import RandomForestClassifier
feat_la

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

haisong chen

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python在地图上画路线_如何在python中绘制热地图（实例）

weixin_39775354的博客

11-29

1057

当我们进行数据挖掘工作、或者进行数据可视化以更好地展示成果时，很多时候我们需要借助到热地图的帮助。今天，我们就来介绍一下在seaborn绘图库中热地图heatmap的使用方法及参数设置。热地图使用场景：进一步查看数据表中特征两两之间的相关性在数据挖掘的前期工作中，对于研究特征关系十分有效一、函数体及主要参数函数体：seaborn.heatmap(data, vmin=None, vmax=None...

数据分析与挖掘1——数据探索

Mrs.King的博客

09-17

289

1.变量识别确定输入变量(特征)、输出变量(target) 确定数据类型——数值型数据、字符型数据连续型变量&类别型变量 2.变量分析单变量分析：箱型图和直方图，统计连续变量的中心分布趋势和变量分布；出现次数和占比衡量类别型变量箱型图 import seaborn as sns plt.subplot(7,8,0)#7行8列的子图，当前子图为第0号 sns.boxplot(train_data['sex'],orient='v',width=0.5)#orient竖直方向的箱型图；w

参与评论您还未登录，请先登录后发表或查看评论

Bessie_Lee

04-01

4355

pandas数据处理基础之变量相关性分析

mocas_wang的博客

11-18

8218

nlp 电商评论处理 -史诗级长文

weixin_30650039的博客

05-07

421

#auther bioamin #nlp of 电商评论 #-*- conding = utf-8 -*- import numpy as np import pandas as pd #画图的包 import matplotlib.pyplot as plt import seaborn as sns plt.rcParams['font.sans-serif']=['Si...

标准-《金融数据安全数据安全评估规范（征求意见稿）》.pdf

03-15

该规范涵盖了金融数据安全评估的全过程，从金融数据安全管理评估到金融数据安全保护评估、金融数据安全运维评估，最后到金融数据安全评估结果。金融数据安全评估的目的在于确保金融机构能够识别和评估其金融数据...

金融数据分析导论（包含代码和数据）

03-05

《金融数据分析导论》是一本深入探讨金融领域中数据分析理论与实践的综合资源包，它不仅提供了详尽的理论知识，还附带了实际的代码示例和相关数据集，帮助学习者更好地理解和应用金融数据分析技术。这个压缩包的内容...

金融行业问答数据集.zip

06-16

《金融行业问答数据集——深度探索与应用》在当今数字化时代，数据已经成为各行各业的核心驱动力，尤其是在金融领域。"金融行业问答数据集.zip" 是一个专门为金融商贸研究准备的数据资源，它包含了丰富的金融问题...

Python金融数据挖掘案例分析zip

12-30

在本案例中，"Python金融数据挖掘案例分析zip"是一个以Python编程语言为基础的数据挖掘项目，专注于北京市的二手房市场。这个项目旨在通过收集、清洗、分析和可视化数据，揭示出北京市二手房市场的各种趋势和特征。...

SmoothNLP 金融文本数据集

06-15

SmoothNLP 金融文本数据集(公开)|Public Financial Datasets for NLP Researches API接口服务推荐研究方向 Embedding (Word2Vec, Bert, 等) 实体识别 - NER 无监督聚类: 基于企业描述信息, 进行竞品聚类企业行业...

【seaborn】的使用笔记

tz_zs的博客

05-14

1266

____tz_zs seaborn库使用笔记风格设置 · # -*- coding: utf-8 -*- """ @author: tz_zs 风格设置 """ import numpy as np import matplotlib.pyplot as plt import seaborn as sns def sinplot(flip=1): x = np....

【画图专题】sns.heatmap的用法简介

Bing's Blog

11-05

8万+

机器学习流程(二)-数据探索EDA

qq_42994177的博客

05-17

907

一、数据概览 df.head(n)：查看DataFrame对象的前n行,默认是5行 data.tail(n)：查看DataFrame对象的后n行,默认是5行 data.info(): 查看索引、数据类型和内存信息 data.isnull()：检查DataFrame对象中的空值，并返回一个Boolean数组　 data.describe()：查看数值型列的汇总统计　　 data_train.shape：查看数据特征维度 data_train.columns：查看数据列名称更多其他操作 1、绘制每个数.

Otto商品分类（一）----数据探索&特征工程

fly_Xiaoma的博客

02-10

1743

目录 ***训练数据探索部分*** 1、导入工具包 2、读取数据 3、标签的分布 3.1 各特征的分布 4、特征之间的相关系数 ***训练数据特征工程部分*** 1、分开特征和标签 1.1 feat编码：log(x+1) 1.2 feat编码：TF-IDF ***其他特征工程*** 一行的最大值、和、非0元素数目将这些特征加到原始特征中 1、数据预处理 2、保存...

人工智能学习笔记——可视化库Seaborn

唯恋殊雨的博客

03-28

2713

import seaborn as snsimport numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inline#写完代码直接把图显示在画布上def sinplot(flip = 1): x = np.linspace(0,14,100) for i in range(1,7): ...

Matlab xcorr函数详解

去向前方的博客

09-30

7万+

Python 学习笔记

Peter_H

07-23

285

Python 学习笔记 pandas library Day #1 df = pd.read_csv(’ ') df.head(n) df.tail(n) df.nlargest(n,‘name’) df.nsmallest(n,‘name’) df [Pd[‘bla bla’]==‘labalaba’] Day #2 df.shape df.columns.tolist( ) df[‘name’...

python数据挖掘---数据清洗篇（附代码）

MISS ZY

06-07

5119

在数据挖掘路上点点滴滴，遇到的数据清洗的一些常用技巧和方法，记录下来，并持续更新。 1.01读取数据不要索引，去掉字段前后空格 train=pd.read_csv('train.csv',skipinitialspace=True,index_col=0) 1.02缺失值处理按列统计缺失值比例，决定去除或者填充 all_missing=all_dummies.isnul...

【Python】绘制热力图seaborn.heatmap，cmap设置颜色的参数