技术分享：基于HBase和Spark构建企业级数据处理平台

最新推荐文章于 2021-03-13 10:29:06 发布

yiyidsj

最新推荐文章于 2021-03-13 10:29:06 发布

阅读量228

点赞数

分类专栏：大数据人工智能互联网文章标签： spark 大数据大数据学习大数据开发大数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yiyidsj/article/details/104250171

版权

基于HBase和Spark构建企业级数据处理平台,面临的场景:金融风控;个性化推荐；社交Feeds;时空时序以及大数据等。作者：大数据与机器学习

技术分享：基于HBase和Spark构建企业级数据处理平台

面临的场景

金融风控

用户画像库
爬虫抓取信息
反欺诈系统
订单数据

个性化推荐

用户行为分析
用户画像
推荐引擎
海量实时数据处理

社交Feeds

海量帖子、文章
聊天、评论
海量实时数据处理

时空时序

监控数据
轨迹、设备数据
地理信息
区域分布统计
区域查询

大数据

维表和结果表
离线分析
海量实时数据存储

新的挑战

Apache HBase(在线查询) 的特点有：

松散表结构(Schema free)
随机查询、范围查询
原生海量数据分布式存储
高吞吐、低延迟
在线分布式数据库
多版本、增量导入、多维删除

面临

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
技术分享：基于HBase和Spark构建企业级数据处理平台

基于HBase和Spark构建企业级数据处理平台,面临的场景:金融风控;个性化推荐；社交Feeds;时空时序以及大数据等。作者：大数据与机器学习面临的场景金融风控用户画像库爬虫抓取信息反欺诈系统订单数据个性化推荐用户行为分析用户画像推荐引擎海量实时数据处理社交Feeds海量帖子、文章聊天、评论海量实时数据处理时空时序监控数...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。