CQU_JIAKE-CSDN博客

原创将WSL2从C盘转移到其它盘

continue中都是什么，可以放心删吗？这个目标，就是文件名，且后缀指定为.tar。

2025-12-05 22:12:44 124

我是计算机体系结构博士，你要作为业界专家指导，PCIE的物理上点对点连接，是不是就是指设备与RC之间的连接，设备通过向RC发送请求，然后RC再处理请求转发给相关设备如NIC或CPU？详细解释，越细节越好。详细解释，越细节越好。我是计算机体系结构博士，你要作为业界专家指导，为什么对内存控制器的访问压力减小会改变内存访问的时序和模式？我是计算机体系结构博士，你要作为业界专家指导，什么叫对Host的建模，对NIC的建模？我是计算机体系结构博士，你要作为业界专家指导，什么是PCIE总线争用问题，上面的话详细说明？

2025-10-24 00:29:14 371

原创 10.23【A】端到端，建模例子（Host,NIC,DMA),RTL,ARCH,NIC模拟器，PCIE（根复合体），内存，modular设计哲学

就是要在模拟器中创建一个。

2025-10-24 00:28:38 993

原创 10.21物理杂谈Q

如果构成所见到的物体的本质之间并无区别，那么万物为什么不是一体？“铀的原子核非常巨大，质子间的库仑斥力巨大”为什么？核力又是怎么来的，怎么产生的？“富含氧和铀的地下水从富铀的基底岩石中淋滤出铀，向上运移”什么意思？例如，它可以将一个下夸克变成一个上夸克”什么是所谓夸克的“味”？你说的这些太颠覆经典力学的认知了，那怎么以这个更先进的理论来解释日常生活中所见到的种种现象。“在量子场论中，粒子是场的激发”什么意思？粒子怎么又是场的激发？地球上的铀元素是如何形成的？什么是所谓奇异夸克？天然铀是以怎样的形式存在的？

2025-10-23 19:15:19 175

原创 9.3【Q】

计算机体系结构中的关键问题分析摘要：本文从计算机体系结构角度探讨了三个核心问题。首先，CPU内核数增加导致单核内存带宽下降的原因在于内存控制器数量有限，共享总线带宽成为瓶颈。其次，详细解释了RDMA技术实现机制，包括MR注册、MTT地址转换及RNIC硬件支持，指出其仍需本地数据拷贝的局限性。最后，分析了x86-64四级页表结构（PML4→PDP→PD→PT），阐述其47位地址空间管理和TLB加速机制。针对内存扩展问题，指出虽技术上可通过NUMA和内存池化实现PB级扩展，但面临延迟一致性、功耗和成本等挑战。

2025-09-04 01:13:12 402

原创 9.3【A】CPU核数与带宽（不能简单地通过增加内存通道数来匹配核心数的增长）内存管理（虚实地址转换回顾，硬件与步骤）RDMA，异构系统

摘要：本文探讨了现代计算系统中的内存管理挑战与RDMA技术。随着CPU核心数增加，内存带宽瓶颈（"内存墙"）和I/O延迟（"I/O墙"）问题日益突出。文章详细分析了从虚拟地址到物理地址的转换流程，包括TLB查询、页表遍历和缺页处理机制。同时介绍了RDMA技术如何通过零拷贝和内核旁路实现高效数据传输，以及异构系统中统一地址空间管理面临的挑战。这些技术为解决内存访问延迟和数据移动效率问题提供了重要思路。

2025-09-04 01:11:39 1114

原创 9.2 【Q】

我是计算机体系结构领域的博士，Software-Based Emulation（如QEMU）与Software-Based Simulation（如gem5)有什么区别？你要作为博士生导师以及相关领域专家详细解释，并给出技术细节。我是计算机体系结构领域的博士，我要学习异构计算，为我推荐一些优质课程与项目，来让我掌握相关的基础知识？你要作为博士生导师以及相关领域专家详细解释，并给出技术细节。你要作为博士生导师以及相关领域专家详细解释，并给出技术细节。我是计算机体系结构领域的博士，什么是DSP？

2025-09-03 00:59:01 253

原创 9.2【A】仿真与模拟,gem5学习（pydot生成图,se与fs，isa与cpu)

摘要：体系结构仿真与模拟的核心差异在于目标不同：仿真（如QEMU）关注功能正确性，通过动态二进制翻译重现目标环境行为，支持运行未修改软件，但缺乏时序精度；模拟（如gem5）追求时序精确性，采用离散事件驱动和微架构模型，详细模拟CPU流水线、缓存等组件，适用于性能评估，但速度极慢（万倍以上延迟）。gem5支持多种指令集（RISC-V、Arm、x86等）和CPU模型（AtomicSimpleCPU、O3CPU等），权衡精度与速度。其复杂语法解析可能引发冲突，编译时需注意内存管理。研究时需根据需求选择工具：功能

2025-09-03 00:58:19 988

原创 9.1【Q】

【计算机体系结构问题摘要】 CPU类型：TIMING是基础时序模型，O3(Out-of-Order)支持乱序执行，通过重排序缓冲区提升IPC，但硬件开销大。 NUMA系统：非统一内存访问架构，节点本地/远程内存延迟差异显著，需软件优化数据局部性。内存异构性：同构内存（如DDR）限制能效比，异构（HBM+DRAM）可匹配不同带宽/容量需求，但管理复杂度高。 CXL技术：通过PCIe协议实现内存池化，保持静态地址映射，物理内存动态共享，突破固定容量限制。 AI带宽需求：GPU计算依赖高带宽（如HBM2e 3.

2025-09-02 01:28:58 261

原创 9.1【A】同构与异构，应用面对的各种墙，CXL图片与cxl.mem，为什么AI训练需要高带宽，HBM

摘要：本文探讨了异构内存系统的必要性及其技术实现，重点分析了CXL协议在内存共享和缓存一致性方面的优势。传统同构DRAM内存面临带宽、能耗、成本和灵活性等瓶颈，而异构系统通过整合HBM、CXL DRAM、PMEM等多种内存技术，为不同应用场景提供定制化解决方案。研究指出，CXL协议通过硬件级缓存一致性支持，使内存资源池化成为可能，特别适合AI训练等需要高带宽的场景。文章还解析了HBM通过3D堆叠和宽接口实现超高带宽的技术原理，展现了异构内存架构在提升系统性能方面的潜力。

2025-09-02 01:28:24 1125

原创 8.31【Q】CXL-DMSim:

【摘要】本文针对计算机体系结构领域的博士生，系统解答了多个关键技术问题。首先解释了scons构建工具和SConstruct文件在gem5模拟器编译中的作用。在性能评估方面，详细分析了STREAM带宽测试原理和聚合带宽概念，指出CXL内存设备相比本地DDR具有2-3倍延迟但能提供45-83%的带宽。特别讨论了3.4%的模拟器误差来源，包括时序建模精度和硬件差异。通过对比RDMA与CXL的技术差异，深入剖析了IO语义（基于网络包处理）与内存语义（直接load/store操作）的本质区别。研究结果表明，CXL内存

2025-08-31 23:54:12 418

原创 8.1【Q】VMware相关

摘要：针对VMware虚拟机常见问题进行解答：1）网络配置推荐NAT模式（共享宿主机IP），避免仅主机模式；2）在虚拟机中安装Docker需先配置网络连接；3）解决宿主机-虚拟机剪贴板共享问题需安装VMware Tools。这些操作均需根据具体环境进行适当调整。（149字）

2025-08-31 23:52:55 257

原创 8.31【A】scons,带宽，语义semantic，读论文颜色规范，系统运行命令

本文摘要探讨了现代软件构建工具scons的工作原理及其在gem5模拟器中的应用。scons是一个基于Python的构建系统，能自动处理编译依赖关系，支持并行编译（如-j16参数）。文章还介绍了内存带宽测试工具STREAM、计算机体系结构中的带宽概念、聚合带宽优化策略，以及CXL技术在内存扩展中的应用。最后，提及了gem5模拟器的使用命令示例，展示了如何配置和运行x86架构下的CXL测试。全文涵盖了从软件构建到硬件性能分析的关键技术要点。

2025-08-31 23:51:14 846

原创 25.8.7【A】obsidian templater使用

本文介绍了一个基于模板的自动化文件管理脚本。该脚本实现以下功能：1) 支持调试日志输出；2) 自动获取当前日期信息；3) 按年/月创建分层文件夹结构；4) 自动将当前文件移动到对应的日期文件夹中；5) 添加创建时间标记和日程模板。该方案适用于日记管理等需要按日期自动归档的场景，通过模板语法简化了文件管理流程，提高了工作效率。

2025-08-08 00:43:46 243

原创 6.10【A】cv neus nerf

2025-06-11 17:40:23 155

原创 6.10[A]BB84 量子

在 Eve 拦截测量的那一刻，基信息的公开讨论尚未发生，她只能靠猜！需要查IP表置换M的位置。

2025-06-11 17:39:43 261

原创 6.10【Q】网络安全期末复习

我正在复习网络安全，准备考试，椭圆曲线中，P+Q=R和2P=P+P=R是什么意思？我正在复习网络安全，准备考试，分组密码（块密码）是什么意思，如何运作的，流程怎样？我正在复习网络安全，准备考试，MD5算法的过程是怎样的？我正在复习网络安全，准备考试，普莱费尔密码的代换规则，过程是怎样的？我正在复习网络安全，准备考试，ARP欺骗的过程是怎样的？我正在复习网络安全，准备考试，DES数据加密的标准过程是怎样的？我正在复习网络安全，准备考试，DES的S盒是如何发挥作用的？我正在复习网络安全，准备考试，？

2025-06-11 17:39:09 577

原创 6.4编译原理

详细解释，越细节越好。我正在学习编译原理，所有的p_need都不是空指针，就是部分函数的ParameterList存在问题，到底为什么会出现问题？我正在学习编译原理，对于这行代码，为什么仅仅是把它解注释掉，部分测试点就会出问题，即使完全没有用？我正在学习编译原理，当前输出的这个，对应的都是哪些原代码？我正在学习编译原理，现在就是存在问题，对于desired_type的获取可能会发生混乱，造成严重的问题？我正在学习编译原理，现在问题是，不管写什么，只要加上这一行，就会不通过部分测试点，到底是为什么？

2025-06-07 02:52:35 647

原创 5.21【Q】netSafe exp4

我正在学习网络空间安全，当我运行上面的命令后，页面上是没有内容的，那我如何去看结果？详细解释，越细节越好？详细解释，越细节越好？我正在学习网络空间安全，已知对于id字段存在SQL注入点，那么怎么获取以下信息？详细解释，越细节越好？详细解释，越细节越好？我正在学习网络空间安全，为什么输入url后，部分信息会变成%+数字的内容？详细解释，越细节越好？详细解释，越细节越好？详细解释，越细节越好？详细解释，越细节越好？我正在学习网络空间安全，详细解释，越细节越好？我正在学习网络空间安全，详细解释，越细节越好？

2025-05-13 09:36:10 626

原创 5.6【Q】NetSafe exp3

我正在完成网络空间安全作业，为什么隐写，在修改时是对RGB图像的每个通道做修改？详细解释，越细节越好。我正在完成网络空间安全作业，现在的卡方检测存在问题，如果图片像素很大，而隐写的信息很小，那么卡方检验效果会很差，如何改善？我正在完成网络空间安全作业，为什么对于灰度图像的直方图，长度是256的一维数组？我正在完成网络空间安全作业，什么是所谓的“高位”？我正在完成网络空间安全作业，2i,这个i是在遍历的什么？我正在完成网络空间安全作业，什么是直方图？我正在完成网络空间安全作业，RGB图像的原理是什么？

2025-05-07 10:49:56 402

原创 5.6【A】netsafe exp3

raise ValueError("秘密信息过长，无法嵌入到图像中")print(f"卡方检测p值: {p_value:.4f}")print("检测结果: 可能不存在LSB隐写")print("检测结果: 可能存在LSB隐写")print(f"提取的秘密信息: {secret}")# 计算p值（自由度为128-1=127）"""将文本转换为二进制字符串""""""将二进制字符串转换为文本""""""LSB信息隐藏函数""""""LSB信息提取函数"""# 统计所有通道的颜色分布。"""卡方检测函数"""

2025-05-07 10:49:47 741

原创 5.3【T】pc

Rank 1 运行的节点名称: ecs-1a28-326c-0001。Rank 2 运行的节点名称: ecs-1a28-326c-0002。Rank 5 运行的节点名称: ecs-1a28-326c-0002。Rank 1 运行的节点名称: ecs-1a28-326c-0001。Rank 1 运行的节点名称: ecs-1a28-326c-0001。Rank 1 运行的节点名称: ecs-1a28-326c-0001。Rank 1 运行的节点名称: ecs-1a28-326c-0001。

2025-05-04 13:34:11 884

原创 5.2~5.3[Q]pc exp4

if (rank!我正在完成并行计算作业，上面这个，MPI_Bcast的参数是什么意思？详细解释，越细节越好i < size;i++) {我正在完成并行计算作业，这个displs是什么意思，下面的MPI函数里，各参数又是什么意思？详细解释，越细节越好// OpenMP并行计算（每个进程使用2线程）i++) {j < m;j++) {我正在完成并行计算作业，这里按列并行计算的逻辑是什么，分发后各进程持有转置矩阵的格式是k*m吧？怎么和x的n*1做乘法？

2025-05-04 03:34:13 684

原创 4.3【A】pc-矩阵转置，分块+simd详解，战绩可查，10s-＞1s！！！！！！！！！！

转置时间为：2.15163当前使用了OpenMp,线程数为：1节点名称: ecs-1a28最后一个元素值: 29495040运行时间: 2.81112 秒转置时间为：1.48388当前使用了OpenMp,线程数为：2节点名称: ecs-1a28最后一个元素值: 29495040运行时间: 2.44423 秒转置时间为：1.1559当前使用了OpenMp,线程数为：3节点名称: ecs-1a28最后一个元素值: 29495040。

2025-05-04 03:33:53 584

原创 4.22【Q】pc homework4

else{ //进程号为奇数 MPI_Recv(new_msg, size, MPI_INT, (my_rank+comm_sz-1) % comm_sz, 0, comm, MPI_STATUS_IGNORE);详细解释，越细节越好。我正在学习并行计算，在MPI中，MPI_Send和MPI_Recv是如何进行匹配的？

2025-05-02 02:54:25 638

原创 4.22【A】pc homework4

4在奇偶交换排序中，，若直接使用MPI_Send和MPI_Recv的阻塞式通信，可能会发生死锁：假设进程i和i+1同时在偶阶段或奇阶段调用MPI_Send向对方发送数据，由于MPI_Send是阻塞的，发送方会一直等待接收方调用MPI_Recv。此时，两个进程均卡在发送操作，无法执行后续的接收操作，导致死锁，发生程序挂起。此外MPI_Send。

2025-05-02 02:54:15 583

原创 4.29[Q]NLP-Exp2

x = tf.keras.layers.MaxPooling1D(2)(x) # 逐步缩短序列长度我正在完成自然语言处理作业，“x = tf.keras.layers.MaxPooling1D(2)(x) # 逐步缩短序列长度”什么意思？里面的2是什么意思？详细解释，越细节越好。

2025-04-30 14:36:12 1099

原创 4.29[A]Exp2

*卷积核的维度**：Conv1D的卷积核实际上是在一维方向上滑动，即沿着max_seq_len方向。例如，如果卷积核的大小是3，那么它会在每个时间步上覆盖3个连续的词向量（即3个时间步）卷积核要想确定最后输出的数据格式，为了提取边缘特征，所以要采用valid的方式进行一个填充，填充完后再用卷积核提取，即old+1-conv。# for kernel_size in [3, 4, 5]: # 常用卷积核尺寸。移动方向的变化，才是决定Conv1D的真正原因，而非要处理的矩阵维度。# 拼接所有卷积层的输出。

2025-04-30 14:36:01 914

原创 4.29【A】netsafe

数据未能反映真实分布（如安卓恶意软件检测中，良性样本多来自Google Play，恶意样本多来自小众市场）。：标签存在噪声或随时间漂移（如依赖VirusTotal的扫描结果，但不同引擎的判定可能不一致）。：验证标签（如人工审核）、使用抗噪声的损失函数（如鲁棒模型）或延迟标签以应对动态变化。：模型可能学习到无关特征（如市场来源），而非真实的安全问题。：混合不同来源数据需谨慎，需明确数据局限性并讨论潜在偏差。

2025-04-30 09:14:40 158

原创 4.29【Q】netsafe

我是计算机研究生，现在我要做一个PPT来讲解个论文，为我生成完整详细的内容？详细解释这篇论文，越细节越好。我是计算机研究生，这篇论文的主题和核心观点，要解决的问题是什么？详细解释这篇论文，越细节越好。详细解释这篇论文，越细节越好。详细解释这篇论文，越细节越好。详细解释这篇论文，越细节越好。详细解释这篇论文，越细节越好。详细解释这篇论文，越细节越好。详细解释这篇论文，越细节越好。详细解释这篇论文，越细节越好。详细解释这篇论文，越细节越好。详细解释这篇论文，越细节越好。详细解释这篇论文，越细节越好。

2025-04-30 09:14:24 193

原创 4.29【Q】paraCompute

还是同样的要求，我要写实验报告，如何组织描述运行时间，加速比，效率等随数据规模，进程数，线程数变化的语言和逻辑，从而显得不冗余和精简？a. 低线程数(1~2线程)：线程数增加显著提升加速比，Size 2000在25进程下，线程从1增至2时加速比提升30%我正在分析并行计算的实验数据，为高斯消元法在openmp和mpi混合并行的优化，分析这张图表，要求描述。我正在分析并行计算的实验数据，为高斯消元法在openmp和mpi混合并行的优化，分析这张图表，要求描述。详细解释，越细节越好。

2025-04-29 21:12:39 491

原创 4.28【Q】paraCompute

高斯消元法算法是是线性代数中的一个算法，可用来为线性方程组求解。给定一个多元线性方程组：其可以用矩阵形式表示：高斯消元法通过一系列的加减消元运算，直到得到未知数个数为1的式子，然后求解得到未知数，逐一回代求解所有的未知数。本选题在高斯消元法的基础上，研究对其的并行化实现，并探索不同并行方式的加速效果。3.2。

2025-04-29 08:39:22 644

原创 4.26【DEBUG-已解决】【Docker】究极离谱连接超时

此外需要注意，如果是WSL2的话，修改WSL2上的那个/etc/docker/daemon.json是没用的，因为Docker是运行在你的Windows上的，你修改虚拟机里的固然是没用，应该修改的是desktop里的Docker Engine。离谱的阿里云，私有镜像源还不能用，看官网指导搓半天也还是403，遂放弃，换其他镜像源，好啊，这次不403了，变TLS超时了。又是Docker又是Docker又是Docker又是Docker。一开始没配置镜像源，认了，用阿里云的镜像源，结果一直403。

2025-04-26 01:27:52 654

原创 4.15【Q】netsafe

我正在学习网络空间安全，“在第二个阶段，攻击者采用真实IP地址向Web服务器发出大量服务请求，从而消耗服务器的计算资源”作为防御者，有Cookie,DRR,黑名单，配额等方式进行防御，考虑成本的情况下，选哪个方式组合实现效果最好？我正在学习网络空间安全，我要进行真实IP地址攻击，目标服务器采用了DRR，我该选择提高真实IP攻击台数还是真实IP攻击速率，在成本有限的情况下，使目标服务器的服务质量下降最高？我正在学习网络空间安全，为什么伪造IP的SYN攻击带宽消耗较低，而SYN-DDos攻击带宽消耗高？

2025-04-17 19:55:47 826

原创 4.15【A】nlp exp1

print(f"平均编辑距离: {result['mean_edit_distance']:.2f}")print(f"句子准确率: {result['sentence_acc']:.2%}")print(f"字符准确率: {result['char_acc']:.2%}")print(f"真实汉字: {truth_hanzi}")print(f"预测汉字: {pred_hanzi}")测试集的格式是这样的，即先给出每行的拼音，然后再给出拼音所对应的汉字。"""读取交替行的拼音-汉字测试集"""

2025-04-17 00:53:54 716

原创 4.14~15【Q】nlp exp1

我正在学习NLP，对于规模，即通用数组长度，我有一个常用2500汉字表.txt文件，能否以此作为初始概率，转移概率，发射概率等矩阵的基础，而不是由相关的训练数据集再来确定规模，对于未出现在2500汉字表的，就用未知来代替，这个思路是否可行，以及如何实现，给出完整实现过程？我正在学习NLP，如果我要构造用于实现拼音转汉字的HMM模型（即每个汉字作为隐状态，而其读音作为观察态），对于现在这个代码，我希望是使用分词后的数组的首汉字是来得到其初始矩阵，而转移矩阵是则不进行分词，以单字进行，代码如何实现？

2025-04-17 00:53:26 628

原创 4.15【A】pc homework3~

为schedule(dynamic,5)时，与静态调度相比，当线程0完成0-4迭代后，还没分配完线程1，2，3，4时，就可能从当前正要分配的位置分配一个块给线程0，然后其它线程再从后面分配。个连续迭代），每个线程分配固定数量的迭代：为schedule(static,5)时，就是编译时循环分配，线程0处理0-4，25-29....线程1处理5-9，30-34....每个线程要处理的迭代都是固定好的；缺点为：开销高，动态分配需维护任务队列，增加运行时同步成本，且缓存不友好，迭代分配不连续，可能降低数据复用率。

2025-04-15 23:12:16 763

原创 4.14【Q】pc homework3

我正在学习并行计算，openMP的静态调度schedule(static [, chunk_size])，以chun_size取5，共100次循环为例，是一次为每个线程直接分配20个，还是说每个线程循环分配5个，直到100个分配完？我正在学习并行计算，“需通过显式同步和线程私有变量实现归约”什么是显式同步？的私有副本，初始值为归约操作符的默认值“，什么叫sum的私有副本，归约操作符又是什么？我正在学习并行计算，对于矩阵遍历，collapse是如何将其扁平化的，处理后的遍历顺序是怎样的，以。

2025-04-15 22:34:23 881

原创 4.12~4.14【Q】cv homework 6

我正在学习计算机图形学，这段代码定义的BVHAccel是什么意思，Accel代表的是什么意思？我正在学习计算机图形学，这里MeshTriangle在构造它自己的BVH时，用的构造函数是什么？我正在学习计算机图形学，依照BVH树的代码，其树是如何构建出来的？我正在学习计算机图形学，如果BVH数据结构是这样的，该如何判断BVH相交？我正在学习计算机图形学，BVH查找函数是什么？我正在学习计算机图形学，最大进入时间和最小退出时间是如何计算的？我正在学习计算机图形学，SAH划分的思想是什么，和BVH有什么区别？

2025-04-15 09:29:25 594

原创 4.12~4.14【Q】cv homework6

我正在写GAMES101作业6，为什么MeshTriangle的getIntersection要使用bvh的Intersect函数，bvh的intersect函数不就是使用BVHAccel::getIntersection(root, ray)吗，这样不就又调用回去了吗，然后在BVHAccel::getIntersection中，可能会因为Intersection inter = node->object->getIntersection(ray);详细解释，越细节越好。这个ray是什么，dir是什么？

2025-04-14 23:42:06 201

笔试题题目.md

1221START分享

深度强化学习在Atari视频游戏上的应用_石征锦.caj

空空如也