- 博客(6)
- 资源 (10)
- 收藏
- 关注
原创 基于Impala的网易有数BI查询优化总结
本文总结了Impala在网易有数BI应用场景下的最新查询优化经验,并探讨后续进一步优化的思路。文章首先简述有数BI + Impala在网易云音乐等业务使用时遇到的挑战,再介绍进行有数查询优化的重要工具——网易Impala管理服务器,最后结合实际业务问题讨论具体优化方法及下一步计划。
2021-02-22 17:25:56 9862 1
原创 效能提升30%、埋点线下bug率下降50%,网易云音乐数仓建设之路
数据仓库是当前数据中台体系的核心组件之一,也是网易云音乐数据化运营的发动机,本文总结了 2020 年网易云音乐数据仓库团队的一些核心工作、取得的进展以及相关实践经验,希望对读者有所启发。2020 年已结束,网易云音乐(以下简称云音乐)数据仓库团队取得了较为满意的成绩,也获得不小的成长。回顾团队过去一整年的工作,我们主要聚焦于两件事: 数据交付提效 数据质量提升 交付提效我于 2019 年加入云音乐,当时数仓团队给我的第一印象是忙碌、年轻,这群基本都是 90 后的年轻人每天都会加班
2021-02-20 10:45:59 9263 1
原创 Slime:让 Istio 服务网格变得更加高效与智能
Slime 是网易数帆旗下轻舟微服务团队开源的服务网格组件,它是一个为简化云原生而生的智能网格管理器,可以通过服务监控自动感知服务状态智能调整服务治理策略,实现Istio/Envoy的高阶功能。目前slime 包含三个非常实用的子模块:配置懒加载:无须手动配置 SidecarScope,按需加载配置和服务发现信息 Http插件管理:使用新的 CRD pluginmanager/envoyplugin 包装了可读性,可维护性较差的 envoyfilter,使得插件扩展更为便捷 自适应限流:结合监控
2021-02-18 12:03:27 9094
原创 数据沙箱在大数据生产、测试物理集群隔离场景中最佳实践
网易有数大数据平台,引入了一种“数据沙箱”的机制,将代码与代码运行所需要的数据、环境变量解耦,根据代码的运行环境,自动关联所需要的数据和环境变量。一套代码,可以在不同的环境之间,无缝切换。下面,我们重点介绍一下,数据沙箱在生产、测试物理集群隔离场景下的应用。
2021-02-08 18:01:09 16060
原创 海量数据时代,谁能终结污染数据爆发式的扩散?
2020年初新冠疫情爆发,然后迅速在全球范围内扩散,其蔓延速度之快、后果之严重令人生畏。在大数据领域,也存在着类似的扩散问题(异常数据流向下游),其带来的危害有时也是灾难性的。面对这样的问题,我们又该如何解决?本文就对该问题,说明网易有数大数据平台是如何解决离线开发中的快速阻断和高效恢复。
2021-02-07 18:06:20 10204
原创 网易数帆基于 Kubernetes 的 Redis 云原生实践综述
Operator就是“有状态应用容器化”的一个优雅的解决方案,本文将介绍网易数帆旗下的轻舟中间件基于Operator的Redis容器化实践。
2021-02-02 18:11:23 12527 1
网易数据产品实践@网易数帆技术沙龙.pdf
2021-06-24
网易云音乐数仓建设之路@网易数帆技术沙龙.pdf
2021-06-24
利用Intel Optane PMEM技术加速大数据分析.pdf
2021-06-24
ClickHouse在有赞的使用和优化.pdf
2021-06-24
Kyuubi:开源企业级Serverless Spark框架.pdf
2021-06-24
网易数帆开源分布式存储Curve监控、运维与质量体系.pdf
2020-12-13
网易数帆开源分布式存储Curve快照克隆子系统SnapshotClone.pdf
2020-12-13
网易数帆开源分布式存储Curve核心组件之ChunkServer数据节点.pdf
2020-12-13
Curve核心组件之MDS元数据节点-陈威-网易数帆.pdf
2020-12-13
Curve:新一代分布式存储系统设计要点
2020-11-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人