大数据技术选型

最新推荐文章于 2024-05-15 16:22:03 发布

Monk8660

最新推荐文章于 2024-05-15 16:22:03 发布

阅读量1.6k

点赞数 1

分类专栏：总结文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43173012/article/details/103895051

版权

数据仓库的概念

数据仓库的输入输出

输入:

1.1 日志采集系统

1.2 业务系统数据库

1.3 爬虫系统等

输出:

1.1.2 报表系统

1.1.3 用户画像

1.1.4 推荐系统

1.1.5 机器学习

1.1.6 风控系统

项目的技术选型

数据的采集传输: Flume Kafka Sqoop Logstash DataX

Flume:可同时做为数据的生产者和消费者,主要用来作为日志的采集工作
Kafka:作为一个可分布式消息订阅系统,底层使用Scala编写,可水平扩展消息发送与存储的吞吐量,避免的jvm内存与系统内存之间的频繁交换,使用零缓存技术从而加快了数据的读写,减少对象的创建与回收,常用于日志的批量收集与发送,主要用来作消息的分发和削峰填谷
Sqoop:作为Hadoop底层文件系统Hdfs与关系型数据库的传输管道,优点它几乎可以和任何大数据框架无缝集成,缺点是必须以Hadoop底层的 MapReduce 作为依赖才能运行
Logstash :数据收集引擎,作用类似于Kafka,相对于Kafka来说优点为Logstash 的内部有一个跨节点保护的机制,从而可以实现多节点同时输入输出数据,这就与Kafka形成了

最低0.47元/天解锁文章

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
大数据技术选型

数据仓库的概念数据仓库的输入输出输入:1.1 日志采集系统1.2 业务系统数据库1.3 爬虫系统等输出:1.1.2 报表系统1.1.3 用户画像1.1.4 推荐系统1.1.5 机器学习1.1.6 风控系统项目的技术选型数据的采集传输: Flume Kafka Sqoop Logstash DataXFlume:可同时做为数据的生产者和消费者,主要用来作为日志的采集工...
复制链接

扫一扫

专栏目录

Monk8660 CSDN认证博客专家 CSDN认证企业博客

码龄6年

43: 原创

48万+: 周排名

63万+: 总排名

1万+: 访问

: 等级

462: 积分

1: 粉丝

2: 获赞

2: 评论

20: 收藏

私信

关注

热门文章

分类专栏

微服务多数据源 2篇
泛型 1篇
总结 37篇
类 16篇
选择器 1篇

最新评论

Netty网络通信框架
CSDN-Ada助手: 非常感谢您分享关于Netty网络通信框架的博客！这是一个非常重要且受欢迎的技术话题，我们期待您继续分享您对于网络通信框架的深入思考和实践经验。如果您感兴趣的话，我们建议您在接下来的博客中深入探讨Netty的高性能网络编程实践，这将会是一个非常有价值的主题，期待您的杰出分享！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。
大数据技术选型
小哪吒的BD: 学到了，大佬666

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。