自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

CS创新实验室

计算机科学、人工智能、数据分析和大数据方向的研发和教学

  • 博客(311)
  • 收藏
  • 关注

原创 《机器学习数学基础》补充资料汇编

《机器学习数学基础》补充资料汇编

2025-03-13 08:56:15 531

原创 408考研逐题详解:2009年第39题

摘要 题目考查TCP拥塞控制机制。初始拥塞窗口(cwnd)为16KB时发生超时,cwnd重置为1KB,慢启动阈值(ssthresh)设为8KB。随后4个RTT中: 1-3个RTT处于慢启动阶段,cwnd指数增长至8KB; 第4个RTT进入拥塞避免阶段,cwnd线性增至9KB。 答案:C(9KB)

2025-06-12 08:38:07 181

原创 微积分的起源与极限的概念

微积分的发展历程与核心概念 微积分起源于17世纪末,由牛顿和莱布尼茨集前人之大成而创立。其思想源流可追溯至古希腊,欧多克索斯和阿基米德已使用"穷竭法"处理曲线图形问题。16-17世纪科学革命时期,物理和数学中的四大问题推动了微积分的发展:非匀速运动、曲线切线、函数极值、曲线围成的面积和弧长。 积分学源于求曲线围成的面积问题,采用类似割圆术的方法。微分学则是关于求曲线切线斜率的问题,通过割线斜率逼近切线斜率。微分与积分之间存在互逆关系,这是微积分的核心发现。极限概念是微分和积分的基础,包括

2025-06-12 08:00:00 476

原创 CPython 局部变量存储机制:从 “栈上存储“ 看语言实现差异

理解CPython中局部变量的存储机制

2025-06-11 09:13:24 666

原创 408考研逐题详解:2009年第38题

本题主要考查 TCP(Transmission Control Protocol)协议中的序列号和确认序列号机制,以及累积确认原则。

2025-06-11 08:39:26 389

原创 408考研逐题详解:2009年第37题

本题考查的核心知识点是 CSMA/CD 协议的工作原理和最小帧长与网络距离的关系,涉及以太网冲突检测机制。

2025-06-10 10:48:14 264

原创 408考研逐题详解:2009年第36题

本题考查的是以太网交换机的工作原理和 PDU(Protocol Data Unit)的概念,涉及 OSI 模型中的数据链路层(Layer 2)

2025-06-10 08:58:52 304

原创 研读论文《Attention Is All You Need》(14)

关于注意力机制的经典论文研读

2025-06-09 13:03:49 734

原创 408考研逐题详解:2009年第35题

本题考查数据链路层中的后退 N 帧(Go-Back-N, GBN)协议

2025-06-09 12:50:21 404

原创 408考研逐题详解:2009年第34题

本题考查的知识点是计算机网络中的数据传输速率计算,具体涉及奈奎斯特定理(Nyquist Theorem)在数字调制技术中的应用。奈奎斯特定理用于计算在无噪声信道中的最大数据传输速率(比特率)。

2025-06-09 11:02:15 496

原创 408考研逐题详解:2009年第33题

考查计算机网络中OSI模型结构

2025-06-07 09:51:54 460

原创 408考研逐题详解:2009年第32题

本题考查程序员利用系统调用打开I/O设备时常用的设备标识。在题目的详解中,介绍了基于Unix/Linux系统的设备管理机制。

2025-06-07 09:28:55 545

原创 408考研逐题详解:2009年第31题

摘要: 题目考查硬链接和软链接对文件引用计数的影响。F1初始引用计数为1,建立软链接F2不会改变计数,建立硬链接F3会使计数增至2。删除F1后,F3仍指向原inode(计数1),而F2因存储路径失效成为悬空链接(计数0)。答案为A(0、1)。硬链接共享inode并增加计数,而软链接是独立文件,仅存储目标路径,不影响计数。

2025-06-04 13:54:46 1189

原创 研读论文《Attention Is All You Need》(13)

本文摘要(150字): 文章详细介绍了Transformer模型的训练方法。训练数据采用WMT 2014双语数据集(英德450万句对、英法3600万句对),使用字节对编码和词片分词。硬件配置为8块NVIDIA P100显卡,基础模型训练12小时(100000步),大模型训练3.5天(300000步)。优化器采用Adam,学习率采用预热步数(4000步)调整策略:先线性增长,后按步数平方根倒数衰减。模型使用三种正则化方法:残差丢弃(丢弃率0.1)、嵌入与位置编码丢弃,以及标签平滑(ε=0.1)。实验表明,该方

2025-06-04 08:48:51 1214

原创 408考研逐题详解:2009年第30题

摘要 文件访问控制信息应存储在文件控制块(FCB)中(选项A)。FCB是描述文件属性的核心数据结构,包含权限控制、存储信息等元数据。其他选项均不适用:文件分配表(B)管理磁盘块分配,用户口令表(C)存储认证信息,系统注册表(D)仅存系统配置。现代系统中,FCB被inode(Linux)或MFT条目(NTFS)替代,但功能本质相同。答案:A。

2025-06-03 08:55:58 562

原创 408考研逐题详解:2009年第29题

摘要: 本题考查SCAN磁盘调度算法。已知磁头位于105道正向移动,请求序列为35,45,12,68,110,180,170,195。SCAN算法工作原理类似电梯:先处理当前方向上的请求(110→170→180→195),然后调头处理反方向请求(68→45→35→12)。因此正确访问序列为选项A:110,170,180,195,68,45,35,12。SCAN算法适用于传统机械硬盘的磁道调度。

2025-06-03 08:21:46 246

原创 408考研逐题详解:2009年第28题

摘要 本题考察文件物理结构的特点及其适用场景。连续结构适合固定大小文件但扩展困难;索引结构支持高效随机访问且易于扩展,适合中小型文件和超大文件;链式结构(定长/变长块)适合顺序访问和动态增长文件,但随机访问效率低。综合来看,索引结构(B选项)兼具随机访问高效性和良好的扩展性,是本题的最佳答案。

2025-06-02 12:47:43 765

原创 408考研逐题详解:2009年第27题

在32位分段存储系统中,段号占8位,剩余24位为段内偏移地址,因此最大段长为2^24B(选项C)。分段管理将作业地址空间按逻辑单元划分,各段长度不等,逻辑地址由段号和段内地址组成。该解析通过实例说明,当段内地址占16位时最大段长为64KB,由此类推得出本题结论。

2025-06-02 12:21:26 570

原创 《机器学习数学基础》补充资料:韩信点兵与拉格朗日插值法

摘要:中国剩余定理揭示了东西方数学的奇妙呼应。《孙子算经》记载的"物不知数"问题(韩信点兵)比高斯提出的同余定理早了1200年。中国古代数学家通过构造特解和通解的方法,展现了与现代数学一致的思想。这种朴素而深刻的解法,在拉格朗日插值法中再次得到印证,体现了数学思维的一贯性。从南北朝到19世纪,从同余定理到多项式插值,东西方文明在数学领域展现出惊人的默契与共鸣。(138字)

2025-06-01 17:12:02 782

原创 研读论文《Attention Is All You Need》(13)

本文比较了自注意力机制与循环层、卷积层在序列建模中的差异,着重分析了三个关键维度:首先考察各层的总计算复杂度;其次评估可并行计算量,通过所需最小顺序操作数衡量;最后探讨网络长距离依赖的路径长度,指出路径越短越有利于学习远程依赖关系。这三种层类型的对比研究为理解自注意力机制的优势提供了理论基础。

2025-06-01 16:44:02 915

原创 408考研逐题详解:2009年第26题

摘要: 分区分配内存管理方式的主要保护措施是界地址保护(选项A)。分区分配将内存划分为固定或可变分区,每个程序占用连续空间,并通过基址和界限寄存器实现物理隔离。界地址保护防止进程越界访问,确保内存安全,适用于早期分区系统(如DOS)。其他选项(程序代码保护、数据保护、栈保护)虽然也是内存保护机制,但与分区分配的核心保护措施无关,后者主要通过硬件地址界限实现隔离。因此,正确答案为A。

2025-05-31 10:29:49 538

原创 408考研逐题详解:2009年第25题

摘要 题目考察操作系统中死锁的发生条件。系统有8台打印机,K个进程各需最多3台。死锁发生的四个必要条件为:互斥、持有并等待、不可抢占和循环等待。当每个进程已持有2台(差1台完成)且所有资源被分配(K×2≥8)时,系统可能陷入死锁。解得K的最小值为4(选项C)。此时资源耗尽,进程互相等待,形成循环等待,满足死锁条件。 (字数:150)

2025-05-30 16:10:25 802

原创 研读论文《Attention Is All You Need》(12)

本文介绍了Transformer模型中使用的位置编码方法。由于模型不含循环或卷积结构,需要通过位置编码来引入序列顺序信息。作者采用不同频率的正弦和余弦函数生成位置编码,这种编码方式使模型能够学习相对位置关系,且具备处理长序列的外推能力。实验表明,习得式位置嵌入与正弦编码效果相近,但后者更具泛化优势。文中详细解析了位置编码的数学公式及其设计原理,强调了该方法的线性特性支持模型通过相对位置进行注意力计算。

2025-05-30 08:00:00 625

原创 根据遍历序列确定二叉树的定理及其证明

本文通过数学归纳法证明了两条关于二叉树构造的定理:(1)任意n个不同结点的二叉树可由中序序列和先序序列唯一确定;(2)同样可由中序序列和后序序列唯一确定。证明过程展示了如何通过根结点定位和递归子序列划分来构建唯一二叉树。当n=0时为空树;对于n>0时,先序序列首元素或后序序列末元素确定根结点,中序序列划分左右子树,再递归地构造子树。这两种遍历序列组合都足以唯一确定二叉树结构。

2025-05-29 11:28:40 799

原创 408考研逐题详解:2009年第24题

摘要: 2009年第24题考查进程调度算法。高响应比优先算法(HRRN)通过动态计算响应比(等待时间+执行时间),兼顾等待时间和执行时间,避免长进程饥饿。其他算法如时间片轮转(公平轮转)、短进程优先(侧重执行时间)和先来先服务(仅按到达顺序)均未综合考量这两因素。正确答案为D。

2025-05-29 10:28:54 465

原创 哈希技术解析

本文系统阐述了哈希技术的核心原理与应用实践。哈希函数通过数学运算将任意输入转换为固定长度的二进制输出,具备单向不可逆、雪崩效应等关键特性,广泛应用于数据校验、密码存储等领域。文章详细解析了主流哈希算法(如SHA-256)的特点,提供了Node.js和Python的代码实现示例,包括字符串处理、文件校验和密码安全存储方案。特别强调应避免使用MD5等过时算法,推荐结合盐值处理提升安全性。通过鸽巢原理和生日悖论等数学概念,解释了哈希冲突的必然性。不同编程语言实现时需注意数据编码(字节处理)和操作模式(二进制读取)

2025-05-29 09:07:28 518

原创 408考研逐题详解:2009年第23题

依赖硬件多处理器(如多核 CPU、多 CPU 架构)或分布式系统,每个任务由独立的处理单元(如核心)负责。设备(Device):计算机系统中除 CPU 和内存外的硬件资源,如输入/输出设备(键盘、显示器、磁盘、网卡等)。处理机(Processor):是计算机系统中负责执行指令、处理数据的核心硬件组件,通常指中央处理器(CPU)。本题除了考查“并行”的基本概念之外,还要求理解“进程”、“处理机”、“设备”、“通道”的含义。支持异步 I/O:CPU 启动通道后,通道独立完成数据传输,并通过中断通知 CPU。

2025-05-28 08:52:12 230

原创 研读论文《Attention Is All You Need》(11)

摘要 Transformer模型的编码器和解码器各层包含两种核心组件:注意力子层和逐位置前馈网络。前馈网络由两个线性变换和ReLU激活函数构成,输入输出维度为512,中间层维度为2048。在嵌入处理方面,模型使用习得的嵌入向量将输入输出标记转换为特征向量,并共享嵌入层与softmax前线性变换的权重矩阵。这种设计借鉴了现有序列转换模型的优点,同时通过维度缩放(乘以√d_model)优化了嵌入效果。表1对比了不同层类型的计算复杂度特征参数。

2025-05-28 08:26:07 742

原创 研读论文《Attention Is All You Need》(10)

Transformer模型采用多头注意力机制的三种应用方式:1)编码器-解码器注意力层,使解码器各位置能关注整个输入序列;2)编码器自注意力层,各位置可关注编码器前一层所有位置;3)解码器自注意力层,各位置仅能关注该位置及之前的解码器位置,通过掩码处理防止信息逆向流动。这些机制共同实现了序列建模中的有效信息交互。

2025-05-27 09:06:16 733

原创 408考研逐题详解:2009年第22题

摘要: 本题考察中断的分类与触发机制。中断分为外部中断(硬件触发,如键盘输入)和内部中断(指令异常,如除数为0)。关键区别在于来源(外设/CPU)、同步性(异步/同步)及可屏蔽性。浮点下溢通常不触发中断,而访存缺页属于内部中断。答案为A(键盘输入),因其是典型的外部中断事件。理解两类中断的特征及典型场景是解题核心。

2025-05-27 08:45:12 464

原创 408考研逐题详解:2009年第21题

某计算机存储系统由Cache和主存组成,某程序执行过程中访存1000次,其中Cache未命中50次。Cache命中率的计算公式为:命中次数/总访存次数×100%。本题中未命中次数为50次,占总访存次数的5%,因此命中率为95%。正确答案为D。这类题目虽然简单,但需注意题目提供的是未命中次数,而非命中次数。

2025-05-23 09:13:59 361

原创 408考研逐题详解:2009年第20题

该题目考查了总线带宽的计算。已知总线在一个周期内并行传输4B信息,一个总线周期占用2个时钟周期,总线时钟频率为10MHz。首先计算总线周期为2/10M秒,然后根据总线带宽公式(传输数据量/总线周期),得出总线带宽为20MB/s。因此,正确答案是B。

2025-05-23 09:04:04 467

原创 研读论文《Attention Is All You Need》(9)

多头注意力机制(Multi-Head Attention)通过将查询、键和值分别进行多次线性投影,并在不同维度上并行执行注意力函数,从而捕捉来自不同表示子空间的信息。具体而言,查询、键和值被投影到不同的维度($d_q$、$d_k$、$d_v$),并经过多次注意力计算,最终将结果拼接并再次投影,得到最终输出。这种机制允许模型同时关注不同位置的信息,避免了单一注意力头因平均化操作而丢失信息的缺点。在实际应用中,通常使用多个并行注意力头(如8个),每个头的维度降低,但总计算成本与全维度的单头注意力机制相当。

2025-05-22 09:08:40 792

原创 研读论文《Attention Is All You Need》(8)

在注意力机制中,当$d_k$值较小时,加性注意力和点积注意力的表现相似;然而,当$d_k$值较大时,加性注意力在没有缩放的情况下表现优于点积注意力。研究者推测,较大的$d_k$值会导致点积结果的量级增大,从而使softmax函数进入梯度极小的区域。为了抵消这种效应,研究者提出将点积结果按照$\frac{1}{\sqrt{d_k}}$的比例进行缩放。这一调整有助于改善点积注意力在大$d_k$值下的表现。

2025-05-21 09:38:32 1048

原创 408考研逐题详解:2009年第19题

微程序控制器和硬布线控制器是计算机中两种不同的控制信号生成方式。微程序控制器通过存储在控制存储器中的微程序生成控制信号,具有灵活性高、易于修改和扩展的特点,但执行速度较慢。硬布线控制器则通过组合逻辑电路直接生成控制信号,执行速度快,但修改和扩展困难,需重新设计硬件电路。因此,硬布线控制器的特点是执行速度快,但指令功能的修改和扩展难。本题答案为D。

2025-05-21 08:54:15 1120

原创 408考研逐题详解:2009年第18题

本题考察了计算机指令流水线的基本原理及其与CPU时钟周期的关系。指令流水线通过将指令执行过程分解为多个阶段,实现指令级并行,从而提高CPU的吞吐量。在流水线设计中,各功能段的执行时间决定了CPU的时钟周期,时钟周期必须至少等于最长功能段的执行时间。本题中,四个功能段的执行时间分别为90ns、80ns、70ns和60ns,因此CPU的时钟周期至少为90ns。答案选A。

2025-05-20 09:35:23 778

原创 408考研逐题详解:2009年第17题

2009年第17题考查了RISC(精简指令集计算机)和CISC(复杂指令集计算机)的基础知识。RISC通过简化指令集和优化硬件设计提高性能,其特点包括精简指令、硬件加速、流水线友好和寄存器密集型。RISC的关键技术特征包括单周期执行、Load/Store架构、硬连线控制和优化编译器。CISC则通过复杂指令减少程序代码量,其设计特点包括丰富指令集、可变指令格式、微程序控制和内存直接操作。现代架构中,CISC借鉴RISC,RISC增强功能,两者性能差距缩小。根据题目选项,选项A(RISC普遍采用微程序控制器)是

2025-05-20 08:44:08 327

原创 研读论文《Attention Is All You Need》(7)

注意力机制是一种将查询与一组键值对映射到输出的函数,其中查询、键、值和输出均为向量。输出是值的加权和,权重由查询与相应键的兼容性函数计算得出。具体实现中,查询、键和值被分别打包成矩阵 $Q$、$K$ 和 $V$,输出矩阵通过公式 $\text{Attention}(Q, K, V) = softmax(\frac{QK^T}{\sqrt{d_k}})V$ 计算。常见的注意力函数包括加性注意力和点积(乘法)注意力。点积注意力与加性注意力在理论复杂度上相似,但点积注意力在实际应用中更快且更节省空间,因为它可以通

2025-05-19 21:31:06 889

原创 408考研逐题详解:2009年第16题

本题考察了计算机体系结构中的相对寻址方式。机器字长为16位,主存按字节编址,转移指令由操作码和相对位移量两个字节组成。取指令时,每取一个字节PC自动加1。转移指令位于地址2000H,相对位移量为06H。根据相对寻址规则,目标地址为下一条指令地址(2002H)加上位移量(06H),即2008H。因此,正确答案为C。相对寻址方式通过相对位置而非绝对地址实现跳转,支持位置无关代码和程序重定位。

2025-05-18 16:25:41 346

原创 研读论文《Attention Is All You Need》(6)

本文介绍了Transformer模型中的编码器和解码器结构。编码器由6层相同的结构堆叠而成,每层包含两个子层:多头自注意力机制和前馈神经网络,并采用残差连接和层归一化技术。所有子层和嵌入层的输出维度均为512。解码器同样由6层组成,除了包含编码器中的两个子层外,还增加了第三个子层,用于对编码器输出进行多头注意力计算。解码器也采用了残差连接和层归一化,并通过掩码机制防止当前位置关注后续位置信息,确保位置i的预测仅依赖于小于i的已知输出位置。

2025-05-18 14:19:12 948

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除