还在忍受 Matplotlib 那陈旧难用的交互设计吗?想用 Python 画出能在浏览器使用的交互式数据图表吗?想几行代码就能轻松展示大规模数据吗?Bokeh,为你带来非同一般的数据可视化体验。
简介
Bokeh,是在 Github 上由 bokeh 组织开源的Python交互式数据可视化库,项目仓库位于 https://github.com/bokeh/bokeh,目前版本为 2.1.1。不像其他使用原生 GUI 的可视化库,Bokeh 选择了现代浏览器作为交互的图形界面,充分利用了浏览器的普及性和跨平台能力,实现了强大的交互界面。Bokeh 提供了优雅简洁、种类丰富的图表,且具有优秀的交互性能,即使大大型和流式数据集上也有很好的体验。Bokeh 是人们构建可交互图表、仪表盘和数据相关应用的得力助手。
安装
Bokeh安装简单,推荐在 Anaconda 中使用,使用 conda 安装:
conda install bokeh
也可以使用 pip 进行安装,此时 Bokeh 不会安装自带的 examples/ 示例:
pip install bokeh
示例
Bokeh 的使用十分简单,我们先来看一个简单的例子:
from bokeh.plotting import figure, output_file, show# 准备数据x = [1, 2, 3, 4, 5]y = [6, 7, 2, 4, 5]# 输出到HTML文件output_file("lines.html")# 创建一个新的图表,设置标题和坐标轴标签p = figure(, x_axis_label='x', y_axis_label='y')# 绘制直线图表,设置标签和宽度p.line(x, y, legend_label="Temp.", line_width=2)# 展示图表show(p)
可以看到,Bokeh 绘制图表很简单,首先要进行数据的准备;由于 Bokeh 使用浏览器进行可视化展示,所以需要输出 HTML 文件;然后进行图表的创建和设置,再绘制想要的类型的图像,最后进行结果展示就可以了。
运行脚本,程序会生成一个 lines.html 文件,并自动打开浏览器进行图表的展示:
可以看到,Bokeh 使用我们提供的数据,绘制出了 x 和 y 的折线图,并渲染了包括标题、标签等的文本信息。此外,可以看到图表右侧的有一个默认的工具栏,
工具栏包括了:Bokeh 主页,移动,选择放大,滚轮放大,保存为图片,重置和帮助,满足了基本的图表交互需求。
Bokeh 支持丰富的绘图类型,支持多样的渲染选项,定制化能力强。我们可以看稍微复杂一些的例子:
p.line(x, x, legend_label="y=x")p.circle(x, x, legend_label="y=x", fill_color="white", size=8)p.line(x, y0, legend_label="y=x^2", line_width=3)p.line(x, y1, legend_label="y=10^x", line_color="red")p.circle(x, y1, legend_label="y=10^x", fill_color="red", line_color="red", size=6)p.line(x, y2, legend_label="y=10^x^2", line_color="orange", line_dash="4 4")
import numpy as npfrom bokeh.plotting import figure, output_file, showN = 4000x = np.random.random(size=N) * 100y = np.random.random(size=N) * 100radii = np.random.random(size=N) * 1.5colors = [ "#%02x%02x%02x" % (int(r), int(g), 150) for r, g in zip(50+2*x, 30+2*y)]output_file("color_scatter.html", , mode="cdn")TOOLS = "crosshair,pan,wheel_zoom,box_zoom,reset,box_select,lasso_select"p = figure(tools=TOOLS, x_range=(0, 100), y_range=(0, 100))p.circle(x, y, radius=radii, fill_color=colors, fill_alpha=0.6, line_color=None)show(p)
此外,Bokeh 还支持多图表展示、时序数据等多种多样的功能:
Bokeh 还可以制作数据展示的网页应用,可以在网页上直接控制图表的渲染:
总结
Bokeh 功能丰富,适用于绝大部分的数据可视化场景;绘制的图表美观实用,可交互性强;充分利用了现代浏览器的优势,实现了实用性强的数据展示应用;使用 Python 语言,方便数据科学领域的研究者学习使用。
Bokeh 已被广泛应用在实践中,目前项目开发活跃,受到多个开源组织的支持,项目发展前景光明;Bokeh 项目实际包含了以 Python 为主的数据处理和建模部分,以及 JS 为主的前端渲染库 BokehJS,是值得学习的多语言混合项目的典范。