面试记录

最新推荐文章于 2022-07-18 20:34:19 发布

Coolhao_

最新推荐文章于 2022-07-18 20:34:19 发布

阅读量136

点赞数

本文链接：https://blog.csdn.net/yanrong1095/article/details/108637871

版权

WAL undo原子性　redo持久性

WAL: Write-Ahead Logging
先写日志，再写磁盘。具体说，当有一条记录需要更新的时候，InnoDB引擎就会先把记录写到redo log里面，并更新内存，这个时候更新计算完成了。同时InnoDB引擎会在在系统比较空闲的时候，将这个操作记录更新到磁盘里。(比直接写磁盘快)，而且有undo做回滚

MVCC怎么实现

MVCC用于实现提交读和可重复读，
MVCC是通过保存数据在某个时间点的快照来实现的。不同存储引擎的MVCC实现是不同的，典型的有乐观并发控制和悲观并发控制。当

MVCC 利用了多版本的思想，写操作更新最新的版本快照，而读操作去读旧版本快照，没有互斥关系，这一点和 CopyOnWrite 类似。

在 MVCC 中事务的修改操作（DELETE、INSERT、UPDATE）会为数据行新增一个版本快照。

版本号
系统版本号 SYS_ID：是一个递增的数字，每开始一个新的事务，系统版本号就会自动递增。
事务版本号 TRX_ID ：事务开始时的系统版本号。

REDO
UNDO

ES倒排

索引　类型　文档
在这里插入图片描述

数据如何存放：
吕老师：比如一首诗，有诗题、作者、朝代、字数、诗内容等字段，那么首先，我们可以建立一个名叫 Poems 的索引，然后创建一个名叫 Poem 的类型，类型是通过 Mapping 来定义每个字段的类型。比如诗题、作者、朝代都是 Keyword 类型，诗内容是 Text 类型，而字数是 Integer 类型，最后就是把数据组织成 Json 格式存放进去了。
在这里插入图片描述

类型相当于表结构的描述，描述每个字段的类型文档以json形式描述

keyword 和　text类型区别

这涉及到分词的问题，Keyword 类型是不会分词的，直接根据字符串内容建立反向索引，Text 类型在存入 Elasticsearch 的时候，会先分词，然后根据分词后的内容建立反向索引。

如何建立es索引

之前我们说过，Elasticsearch 把操作都封装成了 HTTP 的 API，我们只要给 Elasticsearch 发送 HTTP 请求就行。比如使用 curl -XPUT ‘http://ip:port/poems’，就能建立一个名为 Poems 的索引，其他操作也是类似的。

es分布式原理

数据切分　分片保存副本

Elasticsearch 也是会对数据进行切分，同时每一个分片会保存多个副本，其原因和 HDFS 是一样的，都是为了保证分布式环境下的高可用。

master-slaver架构

在 Elasticsearch 中，节点是对等的，节点间会通过自己的一些规则选取集群的 Master，Master 会负责集群状态信息的改变，并同步给其他节点。

建立索引，mapping先发到master再同步至slave,

性能影响

只有建立索引和类型需要经过 Master，数据的写入有一个简单的 Routing 规则，可以 Route 到集群中的任意节点，所以数据写入压力是分散在整个集群的。

典型应用：日志分析系统

假如一个分布式系统有 1000 台机器，系统出现故障时，我要看下日志，还得一台一台登录上去查看，是不是非常麻烦？但是如果日志接入了 ELK 系统就不一样。比如系统运行过程中，突然出现了异常，在日志中就能及时反馈，日志进入 ELK 系统中，我们直接在 Kibana 就能看到日志情况。如果再接入一些实时计算模块，还能做实时报警功能。

STL　容器底层实现

vector 堆里申请连续内存，扩容时需要重新分配

set map底层实现

set和multiset会根据特定的排序准则自动将元素排序，set中元素不允许重复，multiset可以重复。
map和multimap将key和value组成的pair作为元素，根据key的排序准则自动将元素排序（因为红黑树也是二叉搜索树，所以map默认是按key排序的），map中元素的key不允许重复，multimap可以重复。

为何map和set的插入删除效率比其他序列容器高，而且每次insert之后，以前保存的iterator不会失效？

因为存储的是结点，不需要内存拷贝和内存移动。

unordered_map、unordered_set的底层原理

线程不安全的情况

在对同一个容器进行多线程的读写、写操作时；

在每次调用容器的成员函数期间都要锁定该容器；

在每个容器返回的迭代器（例如通过调用begin或end）的生存期之内都要锁定该容器；

在每个在容器上调用的算法执行期间锁定该容器。

tcp如何确保可靠传输

校验和：

发送的数据包的二进制相加然后取反，目的是检测数据在传输过程中的任何变化。如果收到段的检验和有差错，TCP将丢弃这个报文段和不确认收到此报文段。

确认应答+序列号（累计确认+seq）：

接收方收到报文就会确认（累积确认：对所有按序接收的数据的确认）

TCP给发送的每一个包进行编号，接收方对数据包进行排序，把有序数据传送给应用层。

序列号：TCP传输时将每个字节的数据都进行了编号，这就是序列号。

确认应答：TCP传输的过程中，每次接收方收到数据后，都会对传输方进行确认应答。也就是发送ACK报文。

这个ACK报文当中带有对应的确认序列号，告诉发送方，接收到了哪些数据，下一次的数据从哪里发。

超时重传：

当TCP发出一个段后，它启动一个定时器，等待目的端确认收到这个报文段。如果不能及时收到一个确认，将重发这个报文段。

流量控制：receive commend

TCP连接的每一方都有固定大小的缓冲空间，TCP的接收端只允许发送端发送接收端缓冲区能接纳的数据。当接收方来不及处理发送方的数据，能提示发送方降低发送的速率，防止包丢失。TCP使用的流量控制协议是可变大小的滑动窗口协议。
在这里插入图片描述

如果接收到窗口大小的值为0，那么发送方将停止发送数据。并定期的向接收端发送窗口探测数据段，让接收端把窗口大小告诉发送端。

拥塞控制：

慢开始、拥塞避免、快重传、快恢复

慢开始

当TCP连接进行初始化是，将拥塞窗口置为1。

图中的窗口单位不再使用字节而使用报文段。

慢开始门限的初始值设置为16个报文段，即ssthresh=16；
慢开始和拥塞避免

1.然后开始慢开始算法（指数增长）。当cwnd=16时开始执行拥塞避免算法，呈现线性增长。

2.当拥塞窗口cwnd=24时出现超时，发送方判定为网络拥塞，于是调整门限值ssthresh=cwnd/2=12,同时设置拥塞窗口为1，进入慢开始阶段。

3.按照慢开始算法，发送方每收到一个新报文段的确认ACK拥塞窗口值增加。当cwnd=12时（图中点3）执行拥塞避免算法

快重传和快恢复

4 .当cwnd=16时（图中点4）出现了一个新的情况，就是发送方连续收到3个对统一报文段的重复确认（3-ACK）。发送方执行快重传和快恢复算法。

在图中点4，发送方知道只是丢失了个别的报文段，于是不启动慢开始，而是先进行快重传然后执行快恢复算法。

发送方设置调整门限值ssthresh=cwnd/2=8, 同时拥塞窗口cwnd=ssthresh=8（点5），然后进行拥塞避免算法

快重传：收到3个同样的确认就立刻重传，不等到超时；
快恢复：cwnd不是从1重新开始。

一旦出现超时重传，或者收到第三个重复的 ack 时（快重传），TCP 会把慢启动门限 ssthresh 的值设置为 cwnd 值的一半，同时 cwnd = ssthresh （在有些版本中，会让 cwnd = ssthresh + 3）。

阿里

函数调用过程，栈帧的形成和销毁过程

栈帧的形成和销毁过程

先看几个函数调用过程涉及到的寄存器：
（1）esp：栈指针寄存器(extended stack pointer)，其内存放着一个指针，该指针永远指向系统栈最上面一个栈帧的栈顶。
（2）ebp：基址指针寄存器(extended base pointer)，其内存放着一个指针，该指针永远指向系统栈最上面一个栈帧的底部。
（3）eax 是”累加器”(accumulator), 它是很多加法乘法指令的缺省寄存器。
（4）ebx 是”基地址”(base)寄存器, 在内存寻址时存放基地址。
（5）ecx 是计数器(counter), 是重复(REP)前缀指令和LOOP指令的内定计数器。
（6）edx 则总是被用来放整数除法产生的余数。
（7）esi/edi分别叫做”源/目标索引寄存器”(source/destination index),因为在很多字符串操作指令中, DS:ESI指向源串,而ES:EDI指向目标串.

再看几条简单的汇编指令：
mov ：数据传送指令，也是最基本的编程指令，用于将一个数据从源地址传送到目标地址（寄存器间的数据传送本质上也是一样的）
sub：减法指令
lea：取偏移地址
push：实现压入操作的指令是PUSH指令
pop：实现弹出操作的指令
call：用于保存当前指令的下一条指令并跳转到目标函数。

在这里插入图片描述
栈空间是向低地址增长的，主要是用来保存函数栈帧。