探索符号回归的新境界:SRBench——一个活生生的基准测试库
在遗传编程(Genetic Programming)领域的象征性回归(Symbolic Regression, SR)已经取得了显著的进步,从早期的Koza风格发展到现在与机器学习(Machine Learning, ML)的交叉融合。SRBench正是为了推动这个领域向前迈进的一大步,它是一个公开、可重复且透明的现代象征性回归基准测试库。
项目介绍
SRBench致力于消除GP社区和ML社区之间的交流障碍,通过公开比较多种SR方法来促进两个领域的发展。它解决了SR标准基准测试数据集不足的问题,提供了大量真实世界和合成数据集进行大规模测试。此外,为了实现统一的标准,它要求所有贡献的方法都应遵循scikit-learn兼容的API接口。
项目技术分析
SRBench目前涵盖了14种不同的符号回归方法以及7种其他ML方法,包括先进的算法如AIFeynman、Bayesian Symbolic Regression、Deep Symbolic Regression等。这些方法在252个来自PMLB的数据集上进行了基准测试,其中包括各种有无地面实况模型的过程数据。
项目及技术应用场景
无论是科研工作者还是工程师,都可以利用SRBench来:
- 对新开发的SR方法进行性能评估。
- 比较不同方法在特定问题上的表现,以选择最适合自己的工具。
- 研究新出现的跨学科技术,例如将深度学习应用到符号回归中。
- 在实际工程问题中找到最优解,如预测复杂系统的动态行为或发现物理定律。
项目特点
- 全面性:覆盖了多种最新的SR方法,并不断更新和扩展。
- 可比性:所有方法在同一基准上进行公平的性能对比。
- 开放源代码:所有测试和结果都是公开的,可被广泛复现和验证。
- 易于整合:采用scikit-learn兼容API,方便将新的SR方法集成进来。
如果你对探索象征性回归的潜力,或者想比较不同方法的性能感兴趣,那么SRBench无疑是你的理想选择。加入我们,一起推动这个领域的边界吧!
想要了解更多或贡献你的方法?查看我们的贡献指南,让我们共同塑造未来。
联系我们:William La Cava (@lacava),william dot lacava at childrens dot harvard dot edu。