自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 Happy New Year

问题陈述在以10为基数写入的由0和2组成的正整数中,找到第K个最小整数。约束条件K是介于1和1018之间输入输入来自以下格式的标准输入:K输出将答案打印为整数。在这里,精确值必须打印为整数,即使它很大。不允许使用指数符号(例如2.34e+22)或不必要的前导零(例如0523)。10之间的整数Sample Input 1 Copy3Sample Output 1 Copy22Sample Input 2 Copy11Sample

2022-01-09 10:47:02 270

原创 找出不是两个数组共有的元素

给定两个整型数组,本题要求找出不是两者共有的元素。输入格式:输入分别在两行中给出两个整型数组,每行先给出正整数N(≤20),随后是N个整数,其间以空格分隔。输出格式:在一行中按照数字给出的顺序输出不是两数组共有的元素,数字间以空格分隔,但行末不得有多余的空格。题目保证至少存在一个这样的数字。同一数字不重复输出。输入样例:10 3 -5 2 8 0 3 5 -15 9 10011 6 4 8 2 6 -5 9 0 100 8 1结尾无空行输出样例:3 5 -15 6

2022-01-04 20:37:11 125

原创 统计学,机器学习,数据挖掘,深度学习

统计学:通过利用概率建立数学模型,收集所观察系统的数据,进行量化分析,总结,做出推理和预测。包含了,调查,收集,分析,预测等。机器学习:对计算机一部分数据进行学习,然后对另外一些数据进行预测和判断。核心是使用算法解析数据,从中学习,然后对新数据做出决策或预测。深度学习:是一种机器学习,基础叫神经网络。机器学习是深度学习的方法论,数学是其背后的理论支撑。数据挖掘:是在大型的数据库中对有价值的信息知识进行获取,属于一种先进的数据信息模式。通过对海量的,杂乱无章的,不清晰的并且随机性很大的数据进行挖掘

2021-11-05 00:22:00 253

原创 Hadoop中Block和Split的区别

1.split文件不可分割,一个文件一个split。通常一个split就是一个block,split size是允许用户自定义的,有多少个split,就有多少个mapper。2.HDFS的blockblock的划分是物理划分,每块的大小可以通过hadoop进行设置,是实际的文件大小,而非一个块的大小。Block 非常适合用于数据备份,进而提供数据容错能力和可用性。分布式文件系统中数据块一般远大于磁盘数据块的大小,并且为磁盘块大小的整数倍。...

2021-11-02 22:12:26 1065

原创 YARN的工作机制

Resource Manger(RM):资源调查器,负责管理客户端请求,对各NM上的资源进行统一管理和调度。组成:调度器,程序管理器。Application ManagerAMG)应用程序管理器:负责管理整个系统中所有应用程序,包括应用程序提交,与制度器协商资源以启动等。Schedule:资源调度器 根据容量,队列等限制条件,将系统中的资源分配给各个正在运行的应用程序,调度器仅根据各个应用程序的资源需求进行资源分配。而资源分配的单位是container.Container:容器 是yarn...

2021-11-02 21:59:30 64

原创 HDFS读数据

1.客户端连接分布式文件系统,2.访问Namenode查询名称节点中所储存的元数据信息;3.读取文件块位置列表并返回输入流对象;4.客户端向输出流对象请求读取数据;5.输入流对象直接从数据节点以文件流的方式获取数据输出节点向输入流中写入数据6.客户端完成读取后关闭与输出流连接...

2021-10-30 00:03:05 49

原创 HDFS写数据流

HDFS写数据流流程:1.客户端通知名称节点请求写入操作。2.名称节点检查权限,通过后,名称节点创建一个新的文件记录并返回一个文件系统的数据输出流对象给客户端 (一个数据结构,用来完成数据节点与名称节点之间的通信)3.客户端按块对文件进行划分,通过文件流的方式向数据节点中写入数据。4.数据流通过管道传输给数据节点,第一个数据节点储存获得的数据包然后转给下一节点。5.数据块写入操作完成后数据节点向客户端发出确认信息,再有客户端向名称节点发出结束,并将块信...

2021-10-26 22:09:55 154

原创 节点距离计算

Distance(d1/r1/n1,/d1/r1/n3)=2 同一机架上不同的节点Distance(d1/r1/n1,/d1/r2/n3)=4 同一数据中心不同机架上的节点Distance(d1/r1/n3,/d2/r2/n3)=6不同数据中心的节点从节点开始,向上寻找要计算的两个节点的路线重合的终点,从节点到机架距离为1,机架到集群距离为1。两个节点到达最近祖先的距离总和。例如:d1/r1/n1, d2/r1/n3 的距离为6. 首先n1到r1的距离为1;r1到d1的距离...

2021-10-26 20:24:18 93

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除