自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 信用评分卡 Week3(2)

演练:训练和验证逻辑回归模型 任务目标 构建逻辑回归模型并对数据样本进行预测 理解和掌握逻辑回归模型性能的评价指标和方法 理解过拟合的产生以及通过惩罚项进行抑制的方法 任务描述 【dataset/titanic_train.csv】文件包含了泰坦尼克号乘客信息及其是否幸存的记录,各个字段含义如下: PassengerId:乘客ID Survive:标签,标记乘客是否生还 Pclass:乘客等级(1/2/3等舱位) Name:乘客姓名 Sex:性别 Age:年龄 SibSp:兄弟姐妹的个数 Parch:

2021-07-18 01:19:34 341

原创 信用评分卡 Week3 (1)迭代

import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.ensemble import RandomForestRegressor import seaborn as sns from scipy import stats import copy from sklearn.model_selection import train_test_split train_data = pd.read

2021-07-18 01:13:18 355

原创 信用评分卡 DAY13-14

在前一阶段评分卡的建立后,对需求进行分析,考虑添加前端以网页形式进行展示。 网页设计目标 面向客户的网页 面向银行工作人员的网页 面向客户的网页 设计目标:对用户基本信息进行评价,得到其信用分数。 输入:用户姓名;用户年龄;用户月薪;用户负债情况 输出:用户信用评分 待解决问题:用户负债情况是否会得到准确度量信息?考虑删除该部分,单纯采用用户年龄、用户月薪进行大概评分估计。 面向银行工作人员的网页 设计目标:为银行工作人员提供用户信用分数,基于银行用户信用的基本情况,用以提供银行是否批准用户相关操作的数

2021-07-11 23:47:02 91

原创 信用评分卡DAY8-9

演练:训练和验证逻辑回归模型 任务目标 构建逻辑回归模型并对数据样本进行预测 理解和掌握逻辑回归模型性能的评价指标和方法 理解过拟合的产生以及通过惩罚项进行抑制的方法 任务描述 【dataset/titanic_train.csv】文件包含了泰坦尼克号乘客信息及其是否幸存的记录,各个字段含义如下: PassengerId:乘客ID Survive:标签,标记乘客是否生还 Pclass:乘客等级(1/2/3等舱位) Name:乘客姓名 Sex:性别 Age:年龄 SibSp:兄弟姐妹的个数 Parch:

2021-07-11 22:54:03 220

原创 信用评分卡 DAY5-7

演练:拆分数据集 任务目标 使用多种方法将数据集拆分成训练集、验证集和测试集 确保拆分后的数据集是随机组合的,而不是顺序按比例截断的 使用K折拆分的方法以生成适合交叉验证的数据集 观察拆分后的数据集中,样本标签分类的不均衡性,并找到恰当的方法确保均衡性 任务描述 针对sklearn自带了iris(鸢尾花)数据集,完成下列任务: 熟悉iris数据集:查看iris数据集结构,统计样本标签分类的分布情况 按比例拆分训练集和测试集:分别使用train_test_split和自定义方式,按8:2拆分训练集和测试

2021-07-08 09:48:37 259

原创 信用评分卡 DAY10-12

import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.ensemble import RandomForestRegressor import seaborn as sns from scipy import stats import copy from sklearn.model_selection import train_test_split train_data = pd.read

2021-07-08 09:42:25 234

原创 信用评分卡 DAY2-4

项目阶段目标: 数据处理: 异常数据清洗、分箱、特征权重描述 项目阶段内容: 数据清洗 1、 首先将表头改为中文方便操作 states={ 'Unnamed: 0':'id', 'SeriousDlqin2yrs':'好坏客户', 'RevolvingUtilizationOfUnsecuredLines':'额度比值', 'age':'年龄', 'NumberOfTime30-59DaysPastDueNotWorse':

2021-07-02 09:27:33 123

原创 信用评分卡模型 DAY1

学习目标: 环境搭建、对整体项目建立认识 学习内容: 1.配置python环境 2.学习使用库 3.掌握信用评分卡算法模型 学习产出: Python环境安装与配置 提示:面向电脑中没有安装python环境的同学,如已有python环境,则不需要查看此教程安装。 Python版本:python3.6/3.7/3.8均可 1.安装anaconda 下载: 清华镜像下载:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 根据使用电脑选择macosx/

2021-06-29 08:51:22 119

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除