数据挖掘项目（一）

最新推荐文章于 2024-05-24 16:24:03 发布

qingxuanmingye

最新推荐文章于 2024-05-24 16:24:03 发布

阅读量6.2k

点赞数

文章标签：数据挖掘

本文链接：https://blog.csdn.net/qingxuanmingye/article/details/88081171

版权

数据挖掘项目（一）

第一次实践数据挖掘。虚心学习。
基于机器学习的数据分析模型的建立，主要分为以下几步：数据获取->数据预处理->模型选择->数据统一化->模型建立->模型结果分析
首先要对数据进行评估，数据的大小来决定使用工具。
本数据为金融数据，目的为预测贷款用户是否会逾期。

导入数据

import pandas as pd
import numpy as np
df = pd.read_csv('data.csv',encoding="gbk")
df.head()

删除无关的特征

data1 = df.drop(['trade_no', 'bank_card_no', 'source', 'Unnamed: 0', 'id_name'], axis=1)
data1.info()

缺省值处理(以下参考88080917代码)

print(df.isnull().sum())
count=0
for i in range(85):
    if df.isnull().sum()[i]>250:
        count=count+1
print(count)
print(max(fd.isnull().sum()))

剔除，填充，合并

data1=data1.drop(['student_feature'], axis=1)
data1.dropna(thresh=70, inplace = True)

data_col=['loans_latest_time', 'latest_query_time', 'reg_preference_for_trad']
data2 = data1[data_col]
data3 = data1.drop(data_col, axis=1)

d

最低0.47元/天解锁文章

qingxuanmingye

关注

0
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
数据挖掘项目（一）

数据挖掘项目（一）第一次实践数据挖掘。虚心学习。基于机器学习的数据分析模型的建立，主要分为以下几步：数据获取-&amp;gt;数据预处理-&amp;gt;模型选择-&amp;gt;数据统一化-&amp;gt;模型建立-&amp;gt;模型结果分析首先要对数据进行评估，数据的大小来决定使用工具。本数据为金融数据，目的为预测贷款用户是否会逾期。导入数据import pandas as pdimport numpy as n...
复制链接

扫一扫