安装Altair库
pip install altair
与安装其他第三方库的方法一致。
开始绘制图表
Altair的基本对象是Chart,它将数据框作为单个参数,依靠以下代码定义:
import altair as alt
chart = alt.Chart(data)
Chart有三个基本方法:数据(data)、图表类型(mark)和编码(encode),使用它们的格式如下:
数据(data)
数据顾名思义,直接导入数据框的数据。
Altair 统计图表在实际使用中主要围绕 Pandas Dataframe 构建的。因此想要利用Altair需要有一定的Pandas使用基础。(孙兴华老师的Pandas教程)
导入 Pandas 并创建一个简单的 DataFrame 进行可视化,a 列中有一个分类变量,b 列有一个数值变量:
import pandas as pd
data = pd.DataFrame({
'a': list('CCCDDDEEE'),
'b': [2, 7, 4, 1, 2, 6, 8, 4, 7]})
图表类型(mark)
mark
属性指定了数据在在图上应以怎样的方式精确展示。
有了alt.Chart(data)
图表对象,现在可以指定我们想要的数据可视化图表类型。通过mark
可以方便地访问该属性Chart.mark_*
。例如,我们可以使用Chart.mark_point
将数据显示为一个点: