基于PyTorch重写sklearn，《现代大数据算法》

最新推荐文章于 2024-07-24 10:33:16 发布

weixin_34266504

最新推荐文章于 2024-07-24 10:33:16 发布

阅读量169

点赞数

文章标签：大数据人工智能 python

原文链接：https://my.oschina.net/u/3611008/blog/2878717

版权

2019独角兽企业重金招聘Python工程师标准>>>

HyperLearn是一个基于PyTorch重写的机器学习工具包Scikit Learn，它的一些模块速度更快、需要内存更少，效率提高了一倍。

专为大数据而设计，HyperLearn可以使用50％以下的内存，并在某些模块上运行速度提高50％以上。将支持GPU，并且所有模块都是并行化的。

项目作者Daniel Han-Chen，毕业于澳大利亚新南威尔士大学，专注于AI、NLP和无监督机器学习的推荐和匹配算法。

基于HyperLearn，作者展示了如何让很多机器学习算法更快、更高效。

其中一些很酷的算法：

●  最小二乘法/线性回归的拟合时间相比sklearn减少70%，内存使用减少50%
●  由于新的并行算法，非负矩阵分解的拟合时间相比sklearn减少50%
●  Euclidean算法/余弦相似度算法加快40%
●  LSMR迭代最小二乘法时间减少50%

● 新的Reconstruction SVD算法——使用SVD来估算丢失的数据，比mean imputation方法好约30%

稀疏矩阵运算速度提高50％——并行化
●  RandomizedSVD，速度加快20%~30%
●  New Incremental SVD和Incremental Eig，RandomizedSVD / Truncated SVD
●  等等

项目地址：

转载于:https://my.oschina.net/u/3611008/blog/2878717

weixin_34266504

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。