深度学习
1.实验目的
训练数据,找出合适放贷目标
2.实验内容
1.利用pandas及numpy创建一个随机dataframe并转换为csv文件
import pandas as pd
import numpy as np
data = pd.DataFrame(np.random.randint(60,90,(5,5)),columns=['人品','收入','负债','抵押','环境'])
# print(data)
data.to_csv('data.csv')
如图:
2.查看数据的相关性
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.decomposition import PCA
from sklearn.preprocessing import scale
def a():
raw = pd.read_csv('data.csv',index_col=0)
# 获取数据源
# print(raw)
# print(raw.describe()) # 统计数据数据
# 1、 画图查看数据的相关性
sns.heatmap(raw.corr(),annot=True)
plt.show()
if __name__ == '__main__':
a()
运行出现乱码:
解决:
添加代码:
plt.rcParams['font.family']='simhei'
添加数据:
sns.heatmap(data.corr(),annot=True)
参数设置:annot=True
最后训练数据
完整代码:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.decomposition import PCA
from sklearn.preprocessing import scale
plt.rcParams['font.family']='simhei'
def a():
raw = pd.read_csv('data.csv',index_col=0)
# 获取数据源
# print(raw)
# print(raw.describe()) # 统计数据数据
#1、 画图查看数据的相关性
# sns.heatmap(data.corr(),annot=True)
# plt.show()
# 归一化
data = scale(raw)
# 建模,n_cocmponents:特征数量
model = PCA(n_components=5)
# 训练模型
model.fit(data)
# print(data)
# 累计变异程度-方差
v= model.explained_variance_ratio_
model = PCA(n_components=1)
new = model.fit_transform(data)
# print(new)
rs = raw.join(pd.DataFrame(new,columns=['总分']))
# print(rs)
# 排序
rs = rs.sort_values(by='总分',ascending=False) # 降序
print(rs)
if __name__ == '__main__':
a()
运行结果: