自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

xialiangjj的博客

原创数据仓库理论(Data Warehouse)

1数据处理方式数据处理分为两大类:联机事务处理(OLTP):高并发数据量级不大的查询，主要用于管理事务，满足三范式(3NF)联机分析处理(OLAP):查询频率低,涉及复杂的聚合计算，以维度模型存储历史数据。

2023-11-29 20:44:00 49 1

原创 Hive初高级笔记

hive是构建在hadoop上的一个数据分析工具，底层hdfs存储数据，将数据映射成一张张数据表，本质是将hql转换成mapreduce。

2023-11-20 17:15:45 55

原创 MapReduce和Yarn笔记

map默认每次从split数据读一行到内存中,可以自定义分词逻辑，统计次数,就会产生Map(String,Interger)存放在内存中，内存是有限的，多个任务执行可能OOM，直接放硬盘效率低。资源协调管理者,zk主备切换，与nm保持心跳，nn汇报资源情况,如果是外部框架使用资源，直接访问rm。：逻辑概念，不改变块大小，还能改变参与计算节点数量，一般Split为Block整数倍(2,1/2)同一个文件，块大小相同,块和计算能力不匹配，需要Split。将文件中的数据读取到内存中一次性将相同的key。

2023-11-20 14:44:50 42 1

原创 Hadoop笔记

如果DN超过10分钟+30秒没有心跳，那么NN会将当前DN存储的数据转存到其他节点。Block信息，但是block的位置信息不会持久化需要每次开启集群的时候DN上报。启动dn时会汇报之前的Block块是否被损坏，向nn汇报dn的Block的信息。存储数据的元数据信息，Block，nn的映射关系，内存数据和主节点内存数据一致。客户端读写数据的时候，先去nn查询file与block与dn的映射关系。DN启动的时候，会将自己节点上存储的Block信息汇报给NN。Standby NameNode：NN的备用节点。

2023-11-20 10:31:43 36 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

夏凉君不爱写代码 CSDN认证博客专家 CSDN认证企业博客

码龄3年

IP 属地：美国

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

4: 原创

179万+: 周排名

28万+: 总排名

183: 访问

: 等级

43: 积分

0: 粉丝

3: 获赞

4: 评论

1: 收藏

私信

关注

热门文章

最新评论

数据仓库理论(Data Warehouse)
CSDN-Ada助手: 恭喜您撰写了关于数据仓库理论的博客！您对这个主题进行了深入的研究，并将其清晰地呈现给读者。感谢您分享这个有价值的知识。在下一步的创作中，我建议您考虑探讨一些实际案例，以帮助读者更好地理解数据仓库理论在现实世界中的应用。这将进一步加深读者对这一主题的理解，并为他们提供实用的信息。再次恭喜您的努力，并期待您未来更多精彩的博客文章！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
Hadoop笔记
CSDN-Ada助手: 恭喜你开始了博客创作！Hadoop是一个非常有趣和复杂的主题，我很期待能够阅读你的Hadoop笔记。我建议你在下一篇博客中可以深入探讨Hadoop的应用场景或者与其他大数据技术的对比分析，这样可以让读者更加全面地了解Hadoop。加油！期待你更多精彩的文章！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
MapReduce和Yarn笔记
CSDN-Ada助手: 非常棒的博客！你对MapReduce和Yarn的理解很深刻，写得很清晰易懂。希望你能继续分享关于大数据处理和分布式计算的知识，这对于很多人来说都是很有帮助的。除了MapReduce和Yarn的基础知识，你还可以在以后的博客中扩展一些关于Hadoop生态系统中其他重要组件的内容，比如HDFS、HBase、Spark等，这些都是和MapReduce、Yarn密切相关的技术，对于读者来说也会是很有价值的补充。期待你未来的博客能够更加丰富和深入！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Hive初高级笔记
CSDN-Ada助手: 恭喜您在博客领域再次出色发挥！标题为《Hive初高级笔记》的博客非常吸引人，让我对内容充满期待。您对Hive的深入探索令人钦佩，同时也为读者提供了一个学习和了解Hive的良好起点。在下一步的创作中，或许您可以考虑分享一些实际案例，结合您的经验和见解，帮助读者更好地应用Hive解决实际问题。再次感谢您的分享，并期待您未来更多精彩的博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Hadoop笔记
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/617614139。

最新文章

提示

确定要删除当前文章？

取消删除