Py之Optbinning：Optbinning的简介、安装、使用方法之详细攻略-CSDN博客

本文链接：https://blog.csdn.net/qq_41185868/article/details/125401192

Optbinning是一个Python库，专注于数值特征的最佳分箱，以优化二进制、连续和多类目标的离散化过程。该库提供了严格的数学编程公式，适用于流数据处理。本文介绍了Optbinning的安装、一键计算IV值、变量筛选、分箱可视化、模型评估和评分卡转化等核心功能，展示了其在数据预处理中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Py之Optbinning：Optbinning的简介、安装、使用方法之详细攻略

Optbinning的简介

Optbinning，OptBinning 是一个用 Python 编写的库，实现了一个严格而灵活的数学编程公式，以解决二进制、连续和多类目标类型的最佳分箱问题，并结合了以前未解决的约束。
它是由西班牙Universitat Polit`ecnica de Catalunya， Barcelona 大学的guillermo navas palencia博士做的包。最佳分箱是将数值特征约束离散化到给定二进制目标的箱中，从而最大化诸如 Jeffrey 散度或 Gini 之类的统计数据。分箱是二进制分类中常用的一种数据预处理技术，但当前支持约束的现有分箱算法列表缺乏处理流数据的方法。在这Optbinning文章中，提出了一种新的可扩展、内存高效且强大的算法，用于在流设置中执行最佳分箱。所描述的算法将在开源 python 库 OptBinning 0.7.0 版中实现。

Github：https：//github.com/guillermo-navas-palencia/optbinning/
文档：http：//gnpalencia.org/optbinning/

论文:
Optimal counterfactual explanations for scorecard modelling. https://arxiv.org/abs/2104.08619
Optimal binning: mathematical programming formulation. http://arxiv.org/abs/2001.08025

博客: Optimal binning for streaming data. Optimal binning for streaming data

案例：Tutorials — optbinning 0.14.0 documentation