自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 资源 (5)
  • 收藏
  • 关注

原创 Linux下运行带有Spark依赖的Python脚本

在Python中,你可以把应用写成Python脚本,但是需要使用Spark自带的bin/spark-submit脚本来运行。spark-submit脚本会帮我们引入Python程序的Spark依赖。这个脚本为Spark的PythonAPI配置好了运行环境。首先找到spark的安装目录,一般在Linux下,会将第三方软件安装到/opt目录下面。然后运行下述指令:/opt/spark/b...

2018-07-25 16:37:50 1537

原创 Ubuntu下使用Linux服务器常见操作

进入服务器 ssh username@ip_address输入密码后进入 退出服务器 快捷键:Ctrl + D 将本地文件上传到远程服务器(scp) 在本地终端进行操作,注意不是在服务器上操作。scp -r /home/username/Documents/localfile.txt username@ip_address:/home/username/...

2018-07-25 12:12:15 454

原创 预测模型结果校准——前言

 对于正负样本十分不均衡的问题,通常先进性负采样,然后再对模型进行校准,可参阅文献[1],博客中介绍了Prior Correction 和 Weighting方法。 利用分bin的方法,通过统计训练数据的CTR,对预测的CTR进行校准,建立预测CTR到校准后CTR的映射函数,比如Bining方法。 根据已有的先验知识,以预估值作为变量,观测值作为目标,用回归算法拟合参数。比如Plattin...

2018-07-17 16:05:58 1727

原创 预测模型结果校准——Bining

预测模型结果校准——Bining文献[2]中,将训练集中样本按估计值降序排序,均分成k等分;对于落在某个bin里的新样本,属于某个class的概率等于这个bin中这个class的实例所占的比例。[1] 文献[3]中,(1) 将logistic regression模型的输出结果划分成n个等长的bin,使得,定义了第i个bin的区间范围。对于第i个bin的校准值通过下式获得:即计...

2018-07-17 16:04:49 7021

原创 模型预测结果校准——参数拟合分布

模型预测结果校准——参数拟合分布以预估值作为变量,观测值作为目标,用回归算法拟合参数。(use a calibration layer to match predicted CTRs to observed click{through rates)。Platt Scaling tric approach), 使用LR模型(sigmoid函数)对模型的输出值进行拟合,将模型的原始输出值映射为...

2018-07-17 16:02:32 4795

原创 模型预测结果校准——Isotonic regression

模型预测结果校准——Isotonic regression  方法简介:Isotonic Regression: the method used by Zadrozny and Elkan (2002; 2001) to calibrate predictions from boosted naive bayes, SVM, and decision tree models.[1]Za...

2018-07-16 18:48:13 13706

原创 模型预测结果校准——Platt Scaling

模型预测结果校准——Platt Scaling方法简介:Platt scaling is a method for transforming SVM outputs from  to posterior probabilities (Platt, 1999). [1]Platt (1999) proposed transforming SVM predictions to poster...

2018-07-16 18:45:58 4459

Understand-5.0.948-Windows-64bit.exe

Windows下的静态代码分析工具Understand-5.0.948-Windows-64bit,可以绘制流程图,方便阅读代码。

2020-07-08

统计学习方法.李航.2012

统计学习很好的一本参考书,分享出来以供大家参考学习。

2017-10-21

C++ Primer Plus(第6版)中文版》习题答案

C++ Primer Plus(第6版)中文版》习题答案,希望对大家能有帮助。

2015-12-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除