第二章:数据可视化
首先百度百科matplotlib
通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等。
Matplotlib基础知识
1.Matplotlib中的基本图表包括的元素
x轴和y轴
水平和垂直的轴线
x轴和y轴刻度
刻度标示坐标轴的分隔,包括最小刻度和最大刻度
x轴和y轴刻度标签
表示特定坐标轴的值
绘图区域
实际绘图的区域
首先输入如下代码
%matplotlib inline
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
导入result.csv文件
text = pd.read_csv(r'result.csv')
text.head()
2.7.1 任务一:跟着书本第九章,了解matplotlib,自己创建一个数据项,对其进行基本可视化
最基本的可视化图案有哪些?分别适用于那些场景?(比如折线图适合可视化某个属性值随时间变化的走势)
百度链接如下;http://www.360doc23.net/wxarticlenew/429285372.html
2.7.2 任务二:可视化展示泰坦尼克号数据集中男女中生存人数分布情况(用柱状图试试)。
2.7.3 任务三:可视化展示泰坦尼克号数据集中男女中生存人与死亡人数的比例图(用柱状图试试)。
2.7.4 任务四:可视化展示泰坦尼克号数据集中不同票价的人生存和死亡人数分布情况。(用折线图试试)(横轴是不同票价,纵轴是存活人数)
先分别计算生存和死亡的人数
然后生存的用1来表示,死亡用0表示
排序后绘制
排序前绘制
2.7.5 任务五:可视化展示泰坦尼克号数据集中不同仓位等级的人生存和死亡人员的分布情况。(用柱状图试试)
先把不同仓位生存和死亡的人数计算出来
仓位等级高的生存概率高
2.7.6 任务六:可视化展示泰坦尼克号数据集中不同仓位等级的人年龄分布情况。(用折线图试试)
2.7.7 任务七:可视化展示泰坦尼克号数据集中不同年龄的人生存与死亡人数分布情况。(不限表达方式)