数据分析进阶-superset的使用总结

前言

最近捣鼓了快一个月的superset框架,通过阅读官方文档+动手实践,从部署服务器到完成自己的第一个看板以及开始初步的二次开发后,对superset的了解更进一步,下面将对整个过程中的感受做总结。
前两篇论文涉及superset框架的部署和初步使用,具体可点击博客一博客二

总结

缺陷

1. 在安装的过程中,不同版本的superset大部分都出现了依赖包版本不符需要卸载重装的情况,且官方文档在安装过程中所遇到的坑也没能做出相应的解答;
2. 虽然superset框架的定位中有针对非技术人员,但是对非技术人员来说用户体验相对较差,且容易出现非技术人员执行SQL语句拖垮数据库的情况,因此比较适合懂SQL的用户(上手会快一些);
3. 因为superset框架中没有文件夹或者分类相关的概念,所有的图表、看板等内容都是按属性统统放在一起(一个看板又往往附着较多的图表)。尽管有可以收藏或者浏览器搜索的方法,在数量大的情况下不便于管理;
4. 在用户操作日志层面,对具体的点击仅仅按类别呈现,具体的内容还需要通过点击的方式查看json内容,不是很容易追溯用户的行为(尤其是针对数据泄露的风险层面);
在这里插入图片描述
5. 数据可视化是superset的主体,但是受到框架限制,在可视化的过程中仅能对单表进行操作。若需要用到多个数据表,只能在SQL中联表查询后对结果进行可视化;
6. superset的代码架构相对于竞品redash等会不太清晰,因为其不是按功能分割。另外其使用Flask APP Builder,虽然方便快速开发,但是从中长期来说限制了superset界面的灵活性,在权限系统层面也是十分复杂。

优点

说了这么多superset的缺陷,主要还是为了理性地看待技术,而且要思考产品层面是否因为缺陷而受限,适合的才是更重要的。此外superset也是带着很多好的地方:
1. 极大地节省了人力和时间,在熟悉相关操作后,能够较为快速地根据需要搭建数据看板,且持续跟踪数据情况,也可以增加一些预测性的数据,通过定时刷新的方式可实现数据的更新;
2. superset框架中包含的图例种类较多,在数据可视化层面上能够适应不同的数据,且画图中要求的颗粒度较细腻,虽然需要费点功夫,但画出来的图还是比较直观的;
3. 数据安全问题会让人更为关心,在数据库配置和用户角色权限配置上都有涉及,避免删库、敏感数据被查看等问题,但是用户权限配置会较为繁琐,细致到具体模块、数据表的查看、编辑上;
4. 在数据看板布局上可利用筛选框,且筛选框还可通过对metadata中的数据进行修改来实现对看板中的部分表格执行筛选而不影响其他表格;
5. 对于数据库外的csv文件,可通过上传到数据库内并可视化,且看板上的数据图表可以随意调整(增加、删除),实现速度较快;
6. 在用户认证层面可以自定义,有些公司可能会有自己的统一认证账号系统,通过修改配置即可连接;

二次开发项

在功能不能满足现需求的时候,可以考虑superset框架的二次开发,比如以下的例子:
1. 汉化
superset的汉化不能达到100%,但至少有90%,如下所示
在这里插入图片描述
操作方式:

# 找到superset的config.py修改下面的语言
BABEL_DEFAULT_LOCALE = 'zh'
# 执行以下命令(要在虚拟环境下,superset的目录下)
sudo pybabel compile -d translations

2.添加echats图例
pending
3.用户认证
pending

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值