安全饮用水是全人类的基本需求之一。从法律的角度来看,获得饮用水是一项基本人权。影响水质的因素很多,也是机器学习的主要研究领域之一。它也被称为饮用水分析,因为我们的任务是了解影响饮用水的所有因素,并训练一个机器学习模型,该模型可以对特定水样是否安全或不适合饮用进行分类。
对于水质分析任务,其中包含有关影响水可饮用性的所有主要因素的数据。所有影响水质的因素都非常重要,因此我们需要在训练机器学习模型之前简要探索该数据集的每个特征,以预测水样是否安全或不适合饮用。
一、数据集
下载:
https://raw.githubusercontent.com/amankharwal/Website-data/master/water_potability.csv
如下:
二、案例实践
2.1 读取数据
import matplotlib.pyplot