- 博客(8)
- 收藏
- 关注
原创 信用评分卡 Week3(2)
演练:训练和验证逻辑回归模型 任务目标 构建逻辑回归模型并对数据样本进行预测 理解和掌握逻辑回归模型性能的评价指标和方法 理解过拟合的产生以及通过惩罚项进行抑制的方法 任务描述 【dataset/titanic_train.csv】文件包含了泰坦尼克号乘客信息及其是否幸存的记录,各个字段含义如下: PassengerId:乘客ID Survive:标签,标记乘客是否生还 Pclass:乘客等级(1/2/3等舱位) Name:乘客姓名 Sex:性别 Age:年龄 SibSp:兄弟姐妹的个数 Parch:
2021-07-18 01:19:34 341
原创 信用评分卡 Week3 (1)迭代
import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.ensemble import RandomForestRegressor import seaborn as sns from scipy import stats import copy from sklearn.model_selection import train_test_split train_data = pd.read
2021-07-18 01:13:18 355
原创 信用评分卡 DAY13-14
在前一阶段评分卡的建立后,对需求进行分析,考虑添加前端以网页形式进行展示。 网页设计目标 面向客户的网页 面向银行工作人员的网页 面向客户的网页 设计目标:对用户基本信息进行评价,得到其信用分数。 输入:用户姓名;用户年龄;用户月薪;用户负债情况 输出:用户信用评分 待解决问题:用户负债情况是否会得到准确度量信息?考虑删除该部分,单纯采用用户年龄、用户月薪进行大概评分估计。 面向银行工作人员的网页 设计目标:为银行工作人员提供用户信用分数,基于银行用户信用的基本情况,用以提供银行是否批准用户相关操作的数
2021-07-11 23:47:02 91
原创 信用评分卡DAY8-9
演练:训练和验证逻辑回归模型 任务目标 构建逻辑回归模型并对数据样本进行预测 理解和掌握逻辑回归模型性能的评价指标和方法 理解过拟合的产生以及通过惩罚项进行抑制的方法 任务描述 【dataset/titanic_train.csv】文件包含了泰坦尼克号乘客信息及其是否幸存的记录,各个字段含义如下: PassengerId:乘客ID Survive:标签,标记乘客是否生还 Pclass:乘客等级(1/2/3等舱位) Name:乘客姓名 Sex:性别 Age:年龄 SibSp:兄弟姐妹的个数 Parch:
2021-07-11 22:54:03 220
原创 信用评分卡 DAY5-7
演练:拆分数据集 任务目标 使用多种方法将数据集拆分成训练集、验证集和测试集 确保拆分后的数据集是随机组合的,而不是顺序按比例截断的 使用K折拆分的方法以生成适合交叉验证的数据集 观察拆分后的数据集中,样本标签分类的不均衡性,并找到恰当的方法确保均衡性 任务描述 针对sklearn自带了iris(鸢尾花)数据集,完成下列任务: 熟悉iris数据集:查看iris数据集结构,统计样本标签分类的分布情况 按比例拆分训练集和测试集:分别使用train_test_split和自定义方式,按8:2拆分训练集和测试
2021-07-08 09:48:37 259
原创 信用评分卡 DAY10-12
import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.ensemble import RandomForestRegressor import seaborn as sns from scipy import stats import copy from sklearn.model_selection import train_test_split train_data = pd.read
2021-07-08 09:42:25 234
原创 信用评分卡 DAY2-4
项目阶段目标: 数据处理: 异常数据清洗、分箱、特征权重描述 项目阶段内容: 数据清洗 1、 首先将表头改为中文方便操作 states={ 'Unnamed: 0':'id', 'SeriousDlqin2yrs':'好坏客户', 'RevolvingUtilizationOfUnsecuredLines':'额度比值', 'age':'年龄', 'NumberOfTime30-59DaysPastDueNotWorse':
2021-07-02 09:27:33 123
原创 信用评分卡模型 DAY1
学习目标: 环境搭建、对整体项目建立认识 学习内容: 1.配置python环境 2.学习使用库 3.掌握信用评分卡算法模型 学习产出: Python环境安装与配置 提示:面向电脑中没有安装python环境的同学,如已有python环境,则不需要查看此教程安装。 Python版本:python3.6/3.7/3.8均可 1.安装anaconda 下载: 清华镜像下载:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 根据使用电脑选择macosx/
2021-06-29 08:51:22 119
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人