python时间序列缺失值_时间序列数据中的缺失值Sklearn Random Fores

博主正在使用scikit-learn构建模型预测用户是否能在指定时间内完成目标。面临的问题是数据中存在时间序列特性的缺失值。他们考虑了为每一天建立独立模型和插补缺失值的方法,但两者在实际应用中都不理想。博主寻求一种有效的方法来整合这些数据并训练模型,同时要求模型支持概率估计。
摘要由CSDN通过智能技术生成

我正在尝试使用scikit学习构建一个模型,我想知道最好的方法是处理我特定类型的缺失特性。在

我有一个用户群,每个用户都需要在给定的时间范围内(例如3天)完成一个目标。我有关于每个用户的基本信息,这些信息贯穿始终。我已经针对这些信息训练了一个简单的随机森林分类器,到目前为止,它在预测用户是否会完成目标方面相当出色。在

我也有一个每天的完成百分比分解为所有用户谁已经完成(或没有完成)。两个示例,其中一个用户完成了任务,另一个用户没有完成任务,可能会在三天内出现这样的情况:[[0., 0.58, 1.], [0.2, 0.5, .8]],其中每个功能都是实现目标的百分比。第一个用户在时间范围内达到100%,第二个用户没有

我希望能够在飞行中预测目标完成情况。因此,如果有一个新用户已经过了1天的时间限制,并且已经完成了20%的目标,那么他们的数据可能是这样的:[[.2, NaN, NaN]]

我能看到的将这些数据集成到现有模型中的唯一方法是为每一天拟合一个不同的模型(第一天的模型,第二天的模型,等等)。但这对我的生产环境来说根本不可行。我还考虑过尝试对缺失的值进行插补(对于上面的值,类似于.2,.4,.6),但我知道用户目标的完成往往不是这样的线性的。在

有没有一种好方法可以用这种数据训练模型?或者是scikit learn支持的算法,还是为此类任务而构建的另一个python库?请注意,我的模型还需要支持概率估计。在

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值