Hadoop学习 第四章 Hive 如果让您设计Hive这款软件,要求能够实现1.用户只编写sql语句2.Hive自动将sql转换MapReduce程序并提交运行3.处理位于HDFS上的结构化数据。如何实现?
Hadoop学习 第三章 分布式计算和分布式资源调度 1. 什么是计算、分布式计算?•计算:对数据进行处理,使用统计分析等手段得到需要的结果•分布式计算:多台服务器协同工作,共同完成一个计算任务2. 分布式计算常见的2种工作模式•分散->汇总 (MapReduce就是这种模式)•中心调度->步骤执行 (大数据体系的Spark、Flink等是这种模式)MapReduce概述MapReduce是“分散->汇总”模式的分布式计算框架,可供开发人员开发相关程序进行分布式数据计算。MapReduce提供了2个编程接口:•Map•Reduce其中。
Hadoop学习 第二章 HDFS 1. 什么是HDFS?HDFS全称:Hadoop Distributed File System是Hadoop三大组件(HDFS、MapReduce、YARN)之一可在多台服务器上构建集群,提供分布式数据存储能力2. HDFS中的架构角色有哪些?NameNode:主角色,管理HDFS集群和DataNode角色DataNode:从角色,负责数据的存储SecondaryNameNode:辅助角色,协助NameNode整理元数据。
2 操作系统--进程 涉及到如在同一块区域写东西造成数据覆盖,所以各个进程对共享空间的访问应该是互斥的同一个进程中的两个线程可以执行同一份代码,也可以执行不同的代码① FCFS适合长进程,不利于短进程,短进程等待时间和周转时间过长。② FCFS有利于CPU繁忙型(如科学计算)进程调度,而不利于I/O繁忙型(如事务处理)进程调度。(1)时间片大小为2(2)时间片大小为5短进程优先、优先权高者优先都需要估计进程的预期执行时间,如果估计不准确, 将会影响进程调度结果和系统性能。
6 操作系统--内存 页框和页帧指的是内存在物理上被划分为的一个一个的部分页和页面指的是进程在逻辑上被划分为的一个一个的部分进一步缓和CPU与存储设备之间速度的矛盾10位页号刚好可以表示0-1023一个进程对应一个段表,每个段会对应一个页表,所以一个进程会对应多个页表。
7 操作系统--文件 顺序访问:先要访问块0,才能找到块1直接访问(随机访问):可以直接访问块1,不需要先访问其他块用软链接访问文件通过硬链接访问要慢文件信息缓冲区:如索引结构,就需要把索引表调入到这个区。
8 操作系统--I/O 5.1.1 I/O设备的概念和分类什么是I/O设备?I/O设备的分类--按使用特性I/O设备的分类--按传输速率I/O设备的分类--按信息交换的单位总结5.1.2 I/O控制器I/O设备的机械部件I/O控制器(I/O设备的电子部件)I/O控制器的组成内存映像I/O vs 寄存器独立编址总结5.1.3 I/O控制方式程序直接控制方式中断驱动方式DMA方式
计算机视觉学习 用各种智能算法在图像数据库中找到与要搜索的目标相似的对象。ReID是图像检索的一个子任务,本质上是图像检索而不是图像分类。给定一个监控行人图像,检索跨设备下的该行人图像。将深度学习技术与传统聚类方法相结合,通过深度神经网络学习数据的高层次表示(特征),然后在这些表示上进行聚类分析。其目标是利用深度学习强大的特征提取和表示能力,改进传统聚类方法在高维、复杂和多模态数据上的表现。
Linux学习 1._什么是虚拟机?通过虚拟化技术,在电脑内,虚拟出计算机硬件,并给虚拟的硬件安装操作系统,即可得到一台虚拟的电脑,称之为虚拟机。2._为什么要使用虚拟机?学习Linux系统,需要有Linux系统环境。我们不能给自己电脑重装系统为Linux,所以通过虚拟机的形式,得到可以用的Linux系统环境,供后续学习使用。04_VMware WorkStation安装下载地址。