- 博客(5)
- 收藏
- 关注
原创 零基础入门金融风控预测-01
赛题理解 数据来源 数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postCode和title等信息进行脱敏。 评价指标 竞赛采用AUC作为评价指标。AUC(Area Under Curve)被定义为 ROC曲线 下与坐标轴围成的面积。 赛题流程 数据EDA 特征工程 建模调参 模型融合 ...
2020-09-15 12:29:12
538
原创 决策树知识学习
决策树 本节课学到的知识点比较少,没有获得新知识。也没有得到很好的复习。待接下来进行补习。 主要知识点: 1.决策树是分类的模型 2.分类依据:信息熵 3.信息增益,信息增益率…… 4.过拟合控制方法:cart剪枝,标准化,控制树的深度,叶子结点数量…… 5.ID3/C45/GINI…… ...
2020-08-22 20:40:40
170
原创 2020-08-20
记录机器学习 Task01 任务名称 基于逻辑回归的分类预测 过程中遇到的问题及解决方法: 错误1 用逻辑回归模型拟合构造的数据集 lr_clf = lr_clf.fit(x_fearures, y_label) #其拟合方程为y = w0+w1x1+w2x2 执行时出现错误:Found input variables with inconsistent numbers of samples: [6, 5] 解决1 经过查询为x与y形状不一致导致的问题,返回去看x和y的形状发现y少输入了一个值。更改后问题消
2020-08-20 19:02:12
209
原创 python实现计算器功能的小练习
#知识点梳理 # 计算器的编程本文主要考虑思路:运算最小单元就是两个数的 = - * / n次方,以及一个数的阶乘。。其余都是重复进行运算 # 利用循环实现多个数相乘或相除 # 括号的关系:是又一层的循环。利用函数嵌套关系,将运算函数进行封装。 # 考核 正则表达式的运用 # \d+(\.\d+)?[*/]-?\d+(\.\d+)? 乘除法 # [+-]?\d+(?:\.\d+)? 加减法 # \(.
2020-07-05 10:13:06
522
原创 用python做一个简单的发红包抢红包的小代码块
#___Author___:FENG #___DATE_____:2020/6/30 # 需求:设计一个发随机红包的程序 # 01 定义一个类:发红包的人和抢红包的人 # class People() # 发红包: 人 发一个红包 ,里面存着send_m元,分成send_n份。 红包金额不得小于0.01,份数不得小于1 # 抢红包: 抢红包的金额是随机的,保留小数点2位。 # import random class People(): #定义一个人类,可以抢红包,也可以发红包 def _.
2020-07-01 15:40:21
2414
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅