数据可视化
/*
能力一般,水平有限,希望对正在阅读的你有帮助,祝好!
*/
数据可视化是展示数据的一个非常好的方式,对于多数从事与数据处理相关工作的人而言,“优秀的可视化图形会自己解释要表达的数据规律”是基本的认识。在python语言环境下,要论应用最广的绘图package非matplotlib莫属。本文将以matplotlib 和 seaborn package为基础绘制简单的数据可视化图形。
数据集:iris数据集,可从uci的ml repository获取,或者从sklean、seaborn等package中获得。
uci iris dataset: http://archive.ics.uci.edu/ml/datasets/Iris
语言: python
package: pandas、matplotlib、seaborn等
了解数据集
数据集包含3个类,每个类包含50个实例,其中每个类代表一种iris植物类型。一个类与另两个类是线性可分的;后者是不可线性分离的。
导入package
import os
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings(action='ignore')
sns.set(style='white', color_codes=True)
plt.style.use('seaborn-whitegrid')
导入数据集并对其进行描述统计
# load data
iris =</