![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
文章平均质量分 66
70亿分之一
一个富有局限性的程序员
展开
-
Python 实现中国地图可视化
python做中国地图,倒入Excel表格里的数据原创 2022-11-02 10:35:13 · 2265 阅读 · 0 评论 -
什么是边缘计算
边缘计算是指在用户或数据源的物理位置或附近进行的计算,这样可以降低延迟,节省带宽。在云计算模式中,计算资源和服务通常集中在大型数据中心内,而最终用户则是在网络的边缘访问这些资源和服务。这种模型已被证实具有成本优势和更高效的资源共享功能。但是,新型最终用户体验(如物联网)则需要计算能力更接近物理设备或数据源的实际位置,即网络的"边缘"。原创 2022-10-25 14:33:49 · 999 阅读 · 0 评论 -
京东数据开发面试
1.B树和B+树的区别:B+树中只有叶子节点会带有指向记录的指针(ROWID),而B树则所有节点都带有,在内部节点出现的索引项不会再出现在叶子节点中。B+树中所有叶子节点都是通过指针连接在一起,而B树不会。B+树的优点:非叶子节点不会带上ROWID,这样,一个块中可以容纳更多的索引项,一是可以降低树的高度。二是一个内部节点可以定位更多的叶子节点。叶子节点之间通过指针来连接,范围扫描将十分简单,而对于B树来说,则需要在叶子节点和内部节点不停的往返移动。B树的优点:对于在内原创 2021-07-26 15:28:06 · 331 阅读 · 0 评论 -
spark面试-大数据面试
spark 面试常见问题前言2021年应届毕业生,面试了阿里,腾讯,字节。大数据开发,最后成功上岸。提示:以下是个人面试时遇到的问题,可供参考spark 优化spark有什么特点,处理大数据有什么优势Mapreduce 和Spark有什么区别和联系spark跟hadoop对比spark的技术栈有那些组件,每个组件都有什么功能spark组件spark 中的数据倾斜原因,如何解决groupBy 和reduceBy的区别spark基本工作流程spark宽窄依赖Spark Strea原创 2021-04-10 19:10:54 · 156 阅读 · 0 评论 -
Hadoop面试-大数据面试
1. Hadoop的3种运行模式:独立模式:Hadoop的默认模式,它使用本地文件系统进行输入和输出操作。该模式主要用于调试目的,不支持使用HDFS。此外,在这种模式下,不需要对mapred-site.xml,core-site.xml和hdfs-site.xml文件进行自定义配置。与其他模式相比,此模式的运行速度要快得多。 伪分布式模式(单节点群集):在这种情况下,需要为上述三个文件进行配置。在这种情况下,所有守护程序都在一个节点上运行,因此主节点和从节点都是 完全分布...原创 2021-04-18 16:26:42 · 82 阅读 · 0 评论