Spark--IsotonicRegression(保序回归算法)--记录

保序回归算法用于处理预测值与实际值之间需保持非递减关系的问题,如药物剂量与效果研究。文章介绍了PAVA法解决无序序列,并提到了Spark中的IsotonicRegression类用于训练模型。提供了数据来源及代码实现。
摘要由CSDN通过智能技术生成

保序回归: 给定了一个无序的数字序列,通过修改每个元素的值,得到一个非递减的数字序列,要求是使得误差(预测值和实际值差的平方)最小。比如在动物身上实验某种药物,使用了不同的剂量,按理说剂量越大,有效的比例就应该越高,但是如果发现了剂量大反而有效率降低了,这个时候就只有把无序的两个元素合并了,重新计算有效率,直到计算出来的有效率不大于比下一个元素的有效率。

PAVA法:循环遍历序列,若发现前者A大于后者B,则A和B对应的取值都取(Va*na+Vb*nb)/(a+b),直到整个序列都是P1<P2<...<Pn


Spark中使用IsotonicRegression类,来进行训练保序回归模型

使用的数据地址:链接: https://pan.baidu.com/s/1c33ji28 密码: 9v49

代码实现:

import 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值