使用非线性模型进行数据探索和知识生成
黑盒模型可以自动模拟复杂的关系。与线性模型相比,捕捉数据中的这些趋势可以提高其准确性。
然而,准确性只是好处之一。
我们可以分析模型,了解它们如何做出这些预测。这可以揭示数据集中的潜在关系。在某些情况下,这些关系对我们来说可能是全新的。这就是机器学习如何成为数据探索和知识生成的工具。
此外,提供感知检查以帮助调试模型。这些知识可用于
- 为非线性模型提供特征工程信息。
- 在做出超越模型的决策时提供帮助。
我们将讨论如何从黑盒模型中学习。其中包括理解数据中的重要关系及其性质。
为什么我们可以从非线性模型中学习?
在深入探讨之前,让我们先讨论一下为什么我们可以从这些模型中学习。非线性模型可以模拟我们数据中的非线性关系和相互作用。例如,以图 1 中的二手车价格散点图为例。汽车价格(price
)并不总是随着车