- 博客(5)
- 资源 (1)
- 收藏
- 关注
原创 python:时间戳转标准时间
我们在进行数据处理的时候,经常会用到时间数据。但现实中的时间数据有各种各样类型的:时间戳、字符串、yyyy/mm/dd等。下面为大家介绍如何将时间戳转为为标准的时间格式:import timedef get_date(timestamp) : time_local = time.localtime(timestamp) dt = time.strftime("%Y-%m-...
2018-03-28 18:22:22 4889
原创 逻辑回归模型结果转为标准评分卡Ⅱ
上篇文章介绍了如何将模型结果转换为标准评分卡的形式,下面为大家介绍一种更为直观的评分卡的展现形式:将每个变量的不同取值做成一张表格的形式。这样我们可以更加清晰的知道样本每个变量最终得分的贡献。已知,那么,评分卡可以表示为:其中。为分箱后的取值个数;为变量第个取值对应的WOE;为二元变量,若取分箱后的第个值,则=1,否则=0。最终评分卡展示如下:变量 ...
2018-03-21 10:27:20 10261
原创 逻辑回归模型结果转为标准评分卡Ⅰ
在建立评分卡模型时,我们经常会使用逻辑回归来对数据进行建模。但在用逻辑回归进行预测时,逻辑回归返回的是一个概率值,并不是评分卡分数。下面为大家介绍如何将模型结果转换为标准评分卡。1.评分卡定义已知坏用户的概率为:好用户的概率为:我们可以计算好坏用户比值(坏用户与好用户之比,分子为坏用户),称为比率:评分卡设定的分值刻度可以通过将分值表示为比率对数的线性表达式...
2018-03-20 17:33:26 22824 6
原创 合页损失函数的理解
在学习支持向量机的过程中,我们知道其损失函数为合页损失函数。至于为什么叫这个名字,李航老师的《统计学习方法》上是这么说的:由于函数形状像一个合页,故命合页损失函数。下图为合页损失函数的图像(取自《统计学习方法》): 之前对损失函数的意义一直不是很懂。今天,在看了吴恩达老师的《机器学习》相关视频后,又读了《统计学习方法》的相关内容。对合页损失函数有了自己的理解:横轴表示函数...
2018-03-19 17:49:55 21597 3
原创 数据处理中的拼接与连接
在进行数据分析/数据建模之前,我们常常会对原始数据进行一系列的处理。其中拼接和连接是我们常常使用的处理方法之一。下面为大家介绍一下拼接和连接这两种数据处理方式的异同之处。 拼接和连接都是将若干个存放在不同单元(表)种的数据整合到一个单元(表)中的操作。区别在于,拼接是将不同单元的数据按垂直方向整合;而连接是按水平方向进行整合。 numpy和pandas都有实现拼接和连接...
2018-03-06 15:24:29 4665
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人