python平行(3):【parallel python】与【sklearn joblib的parallel和delayed】性能对比


随机森林的并行写完了。大致采用了两种方法:

1)一种是 python并行(1)中提到的joblib的parallel和delayed方法(具体实现是直接使用sklearn.externals.joblib,因为sklearn优化得很好)

2)第二种是采用http://www.parallelpython.com/的SMP


两者编程都很简单,但效率相差还是挺大的,这里大概贴出三者的编程及时间对比。

首先结论是:parallel python  好于  sklearn joblib的parallel和delayed  好于  sequential的训练。

如果你发现parallel python时间还要多于sequential的训练,那就是实现的有问题,下面我会给出一种错误实现的方式。


首先sequential的训练:

trees=[]
            start_time=time.time()
            for i in range(n_more_estimator):
                tree=MY_TreeClassifier(
                    criterion=self.criterion,
                    max_depth=self.max_depth,
                    min_leaf_split=self.min_leaf_split,
                    max_feature=self.max_feature,
                    bootstrap=self.bootstrap,
                    seed=self.seed,
                    n_jobs=self.n_jobs
                    )
                tree=tree.fit(X, y)
                trees.append(tree)
            sequential_time=time.time() - start_time


其次s

  • 4
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值