- 博客(8)
- 收藏
- 关注
原创 外部排序总结
在实际存储中经常需要对大文件进行存储,因为文件记录多,所以无法将整个文件复制到内存中进行排序,因此需要将待排序的记录存储在外存上,排序时把数据一部分一部分调入到内存中进行排序,在这个过程中进行多次内存和外存之间的交换,这种算法称为外部排序。文件通常是按照块存储在磁盘中,操作系统也是按照块对磁盘上的信息进行读/写操作,因此外部排序的主要时间代价是考虑访问磁盘的次数,即I/O次数。
2024-03-24 18:09:36 887
原创 内部排序总结
通过一趟排序将待排序表划分为独立的两个部分L[1....k-1]和L[k+1...n],使得L[1....k-1]中所有元素小于pivot,使得L[k+1...n]中所有元素大于或等于pivot,则pivot放在最终的位置L(k)上,则完成一次划分。(4)在基于比较的排序算法中,每次比较两个关键字的大小之后,仅出现两种可能的转移,因此可以用一棵二叉树来描述比较判定过程,由此可以证正明:当文件的n个关键字随机分布时,任何借助于“比较”的排序算法,至少需要0(nlog2n)的时间。
2024-03-24 09:32:43 601 1
原创 华为ict比赛云服务笔记
华为云 传统it面临挑战 业务上线慢 扩展困难 可靠性不强 生命周期管理复杂 I/O瓶颈导致延迟 TCO居高不下 华为云交互模式 公有云 华为云stack 边缘云 华为云计费模式 按需计费(用多少收多少费用) 竞价计费(类似于拍卖,但是 不建议在竞价服务器中部署生产环境的业务) 包年/包月(比较适合短期使用比较多场景
2023-11-04 16:41:02 376 1
原创 zookeeper3.5.7安装部署
注意安装前请确认已经成功安装了Hadoop安装前请关闭Spark和Hadoop相关进程(请先关闭Spark,再关闭Hadoop)建立三个文件夹用于存储大数据软件、安装包、日志数据。
2023-09-15 09:39:14 470
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人