各种图形简介
线性图:plt.plot(x,y,*argv)
条形图:plt.bar(x,y)x和y的长度应相等
水平条形图:plt.barh(x,y)x轴成垂直,y轴水平而已
条形图高度表示某项目内的数据个数,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列
直方图:plt.hist(x),数据集种各数据出现的频数/频率图
2d直方图:plt.hist2d(x,y)
直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,其高度与宽度均有意义
饼状图:plt.pie(a,labels=list('abcde'),autopct='%.2f%%'),
散点图:plt.scatter(x,y,*argv)
箱形图:plt.boxplot(x)
词云图:wordcloud.WordCloud(*argv)
根据词频和背景图产生的图
直方图/分布:sns.distplot()
制图实例
In [79]: import numpy as np
In [80]: import pandas as pd
In [81]: import matplotlib.pyplot as plt
In [82]: import wordcloud
In [83]: import seaborn
plt.rcParams['font.serif'] = ['KaiTi']
plt.rcParams['axes.unicode_minus'] = False
names = ['mpg','cylinders','displacement','horsepower','weight','acceleration','model_year','origin','car_name']
df = pd.read_csv("http://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data", sep='\s+', names=names)
In [154]: df['maker'] = df.car_name.apply(lambda x: x.split()[0]).str.title()
...: df['origin'] = df.origin.map({1: 'America', 2: 'Europe', 3: 'Asia'})
...: df=df.applymap(lambda x: np.nan if x == '?' else x).dropna()
...: df['horsepower'] = df.horsepower.astype(float)
1.云词
names = ['mpg','cylinders','displacement','horsepower','weight','acceleration','mo