数据可视化
0、前言
在机器学习中,数据的可视化显得非常重要。对于数据直观的理解,可以帮助我们选择很好的模型,为此做下这篇博客
本篇博客的数据可视化基于matplotlib、scipy、numpy和pandas
1、导入数据
注意array的shape,在编程过程中可以考虑使用assert语句。
2、普通的可视化
使用plt.scatter()方法。X1:横轴,X2:纵轴 ,s:数据点的大小,c:不同类数据的标记
3、带有标记的可视化
- 使用pandas.DataFrame(),对数据进行变形,
- 再对不同类的数据进行提取,
- 最后可视化
c:颜色标记,(b:蓝色。r:红色)
marker:数据点的形状标记
另一种方法:
项目可以在我的github下载.