自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大数据星球-浪尖

主要分享Spark使用及源码,spark 机器学习,图计算,同时会涉及到,如:hadoop,Hbase,Hive,Kafka。保证文章质量,给大家提供一个好的知识分享平台。

  • 博客(15)
  • 收藏
  • 关注

原创 通识 | 数据结构图如何利用大数据框架存

很久没写过文章了,今天就分享一下大数据中的图数据库Janusgraph的存储模型。希望对想做大数据图存储的粉丝有一定的帮助吧。由于没时间画图,所以图片来源于网络和Janu...

2019-10-31 20:44:32 255

转载 你知道 Java 类是如何被加载的吗?

前言最近给一个非 Java 方向的朋友讲了下双亲委派模型,朋友让我写篇文章深度研究下JVM 的 ClassLoader,我确实也好久没写 JVM 相关的文章了,有点手痒痒...

2019-10-30 19:09:55 151

转载 58HBase平台实践和应用—时序数据库篇

OpenTSDB是一个分布式、可伸缩的时序数据库,支持高达每秒百万级的写入能力,支持毫秒级精度的数据存储,不需要降精度也可以永久保存数据。其优越的写性能和存储能力,得益于...

2019-10-28 19:06:45 513

转载 58HBase平台实践和应用-OLAP篇

Kylin是一个底层使用HBase作为存储引擎和查询引擎的的多维分析平台,并对外提供标准SQL查询功能。在超大规模数据集上,Kylin还能达到亚秒级的查询响应。Kylin...

2019-10-25 19:45:01 518

转载 58用户画像实践

作为世界最大的生活服务平台,我们同样也希望用户知道“58就在那儿!”。要做到这一点,我们首先就需要具有对用户洞若观火、明察秋毫的能力,而58用户画像的建设就是以此为目标的...

2019-10-23 20:11:25 1705

转载 基于Elastic Stack的海量日志分析平台实践

背景随着58集团业务的飞速发展,日志数量也呈现指数级增长。传统的日志处理方案,已不再适用,此时急需一套功能强大、稳定可靠的日志处理系统。为解集团燃眉之急,DB部门自201...

2019-10-21 23:05:51 371

原创 如何面对技术倦意|非广告

技术倦意:直白点就是不想搞技术了。因为没有成就,没有突破;滞涨的技术水平,持续的年龄增长,引起技术倦意,职业恐慌!这种心理也会导致自信心不断降低,产生退却心理!大...

2019-10-19 23:34:30 165

转载 实施数据治理项目是数据中心建设的关键,数字化转型的基础

导读企业数字化转型趋势是“数据”引领业务变革,数据集中管控成为大势所趋,如何做好数据共享和数据分析、如何发挥数据资产价值最大化是我们信息化工作首要目标,本文从基本术语及概...

2019-10-18 23:12:58 327

转载 基于 Apache Flink 和规则引擎的实时风控解决方案 ​

对一个互联网产品来说,典型的风控场景包括:注册风控、登陆风控、交易风控、活动风控等,而风控的最佳效果是防患于未然,所以事前事中和事后三种实现方案中,又以事前预警和事中控制...

2019-10-15 19:00:55 650

转载 Apache Beam 架构原理及应用实践

分享嘉宾:张海涛海康威视编辑整理:Hoh内容来源:DataFun Talk出品社区:DataFun注:欢迎转载,转载请注明出处导读:大家好,很荣幸跟大家分享 Apach...

2019-10-13 21:31:45 1147

转载 快手 HBase 在千亿级用户特征数据分析中的应用与实践

分享嘉宾:陈杨 快手编辑整理:Hoh Xil内容来源:BigData NoSQL 12th Meetup出品社区:DataFun注:欢迎转载,转载请注明出处。快手建设 H...

2019-10-11 22:56:46 285

转载 如何把握数据治理项目启动的最佳时机

引言如今,大数据正在社会的各行各业发挥着越来越重要的作用,数据已成为企业的核心资产和重要战略资源,是重要的生产因素。在数据驱动的信息化时代,企业只有将核心业务数据更好地掌...

2019-10-09 23:32:53 238

转载 分库分表需要考虑的问题及方案

作者:jackcooper(文中相关链接请阅读原文获取)Sharding的基本思想就要把一个数据库切分成多个部分放到不同的数据库(server)上,从而缓解单一数据库的性...

2019-10-04 20:41:14 196

转载 系列 | Spark之数据倾斜调优

01一、调优概述有的时候,我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜,此时Spark作业的性能会比期望差很多。数据倾斜调优,就是使用各种技术方案解决不同类型的...

2019-10-03 19:36:56 158

转载 架构选型之痛,如何构造 HTAP 数据库来收敛技术栈?

HTAP,是目前数据库领域比较流行的一个新理念。近日,国际顶级专业分析机构 451 Research 发表了一篇关于 TiDB 的报告《PingCAP eyes US m...

2019-10-01 22:53:49 342

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除