1. 可能会注意到数据丢失或有噪声,或者不一致,例如用于列的错误数据类型,或者没有足够的特定类示例。 2. 查看每个特征的数据分布,可以帮助我们选择数据预处理的方式 3. 有些问题不需要借助机器学习模型就可以解决