学习笔记
浦江张学友
数据挖掘、算法从业者
展开
-
机器学习模型保存pickle、joblib、pmml等三种方式的优缺点
机器学习模型保存pickle、joblib、pmml等三种方式的优缺点joblibsklearn中提供了高效的模型持久化模块joblib,将模型保存至硬盘。文件类型为二进制优点是效率很高(·透明的磁盘缓存功能和懒惰的重新评估(memoize模式)·简单的并行计算),读取速度也相对pickle快。from sklearn2pmml import PMMLPipeline, sklearn2pmmlfrom sklearn.externals import joblibimport pickle原创 2020-06-22 14:37:02 · 4999 阅读 · 0 评论 -
评分卡建模的流程以及细节剖析
评分卡建模的流程以及细节剖析created by hcy 20200620,记录一下自己对评分卡建模的细节梳理评分卡的优势以及缺点优点:可解释性很强、鲁棒性较好,适用于数据量较小的情况缺点:数据量大的情况下分箱速度很慢评分卡的建模流程1. 模型设计,target是如何定义的2. 剔除相关性强的变量,保留其中的一部分这里记录一下相关系数、协方差的概念协方差:在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。COV(X,Y) = E[(X-原创 2020-06-20 22:19:04 · 789 阅读 · 0 评论 -
Python Class中的私有方法
@学习笔记在看别人的源码时经常会遇到以__开头的属性或者方法,在此记录一下面向对象技术简介1,类(Class): 用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。2 .方法:类中定义的函数。3.类变量:类变量在整个实例化的对象中是公用的。类变量定义在类中且在函数体之外。类变量通常不作为实例变量使用。4.数据成员:类变量或者实例变量...原创 2019-06-25 14:43:44 · 2904 阅读 · 0 评论