深度学习过程

最新推荐文章于 2023-07-07 21:37:10 发布

余生羁绊

最新推荐文章于 2023-07-07 21:37:10 发布

阅读量182

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/m0_46202060/article/details/117461373

版权

深度学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

深度学习

1.实验目的

训练数据，找出合适放贷目标

2.实验内容

1.利用pandas及numpy创建一个随机dataframe并转换为csv文件

import pandas as pd
import numpy as np

data = pd.DataFrame(np.random.randint(60,90,(5,5)),columns=['人品','收入','负债','抵押','环境'])

# print(data)

data.to_csv('data.csv')

如图：

在这里插入图片描述

2.查看数据的相关性

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.decomposition import PCA
from sklearn.preprocessing import scale

def a():
    raw = pd.read_csv('data.csv',index_col=0)
    # 获取数据源
    # print(raw)

    # print(raw.describe())    # 统计数据数据

    # 1、 画图查看数据的相关性
    sns.heatmap(raw.corr(),annot=True)
    plt.show()

if __name__ == '__main__':
    a()

运行出现乱码：

在这里插入图片描述

解决：

添加代码：

plt.rcParams['font.family']='simhei'

在这里插入图片描述

添加数据：

sns.heatmap(data.corr(),annot=True)

参数设置：annot=True

在这里插入图片描述

最后训练数据

完整代码：

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.decomposition import PCA
from sklearn.preprocessing import scale

plt.rcParams['font.family']='simhei'

def a():
    raw = pd.read_csv('data.csv',index_col=0)
    # 获取数据源
    # print(raw)

    # print(raw.describe())    # 统计数据数据

    #1、 画图查看数据的相关性
    # sns.heatmap(data.corr(),annot=True)
    # plt.show()

    # 归一化
    data = scale(raw)
    # 建模，n_cocmponents:特征数量
    model = PCA(n_components=5)
    # 训练模型
    model.fit(data)
    # print(data)
    # 累计变异程度-方差
    v= model.explained_variance_ratio_
    model = PCA(n_components=1)
    new = model.fit_transform(data)
    # print(new)
    rs = raw.join(pd.DataFrame(new,columns=['总分']))
    # print(rs)
    # 排序
    rs = rs.sort_values(by='总分',ascending=False) # 降序
    print(rs)

if __name__ == '__main__':
    a()

运行结果：

在这里插入图片描述

余生羁绊

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
深度学习过程

深度学习1.实验目的训练数据，找出合适放贷目标2.实验内容1.利用pandas及numpy创建一个随机dataframe并转换为csv文件import pandas as pdimport numpy as npdata = pd.DataFrame(np.random.randint(60,90,(5,5)),columns=['人品','收入','负债','抵押','环境'])# print(data)data.to_csv('data.csv')如图：2.查看数据的相关
复制链接

扫一扫