- 博客(1211)
- 收藏
- 关注

原创 好题杂题列表
存疑:为什么这种查找(本人代码中的search函数)复杂度是正确的?upd:复杂度就是错的,看本人最新代码的search的写法。#记得重分类,分的细一点,具体到算法(加入到luogu提单里面),这个里面可能有重题,记得去重。#OI做题总结也是,重分类,分的细一点。再次复习0/1trie。
2024-07-16 10:19:11
453
原创 chatunitest的Maven使用
首先Maven有两大类仓库:本地仓库和远程仓库。的时候,会优先在本地仓库里面找对应的依赖,如果本地找不到,会在。(下面会以chatunitest为例具体说明)里面写的远程仓库去找(当然一般的。然后来看看chatunitest。,默认就是远程中心仓库)
2025-06-05 15:22:00
232
原创 第七次作业
a.不会崩溃,因为每个AP都有自己的SSID和MAC地址,当站点发送帧的时候,AP可以通过MAC地址来判断是不是发送给自己的,只不过两个AP会共享带宽;a.不行,因为现在Alice没有任何东西只属于她,也就是说Alice可以干的事情Trudy都可以干,于是Bob没办法分辨到底是Alice发的还是Trudy发的。基于数字签名,因为MAC是需要双方知道一个秘钥s的,而且不同的双方的s还不同,而数字签名只需要利用Alice的私钥即可,所以开销更小。与郑老师交流过了,很多数据都没有给,但是考试的时候会给的。
2025-06-03 17:03:00
815
原创 git使用简单教程
命令(从远程仓库下载数据到本地的操作,但不会自动合并 这些更改到你的当前分支),命令(把你本地的提交上传到远程仓库的操作),在绝大多数项目中这两个URL是一样的。来查看当前本地仓库的分支和其追踪的远程仓库的分支。分支,我们可以在命令行中进行切换到其他分支,此时文件夹的内容就会发生改变。,就会在对应目录下下载一个文件夹,这个文件夹就是本地仓库。允许将一个本地仓库与多个远程仓库相关联),其中。来将本地仓库分支上传到远程仓库分支和。来将远程仓库分支下载到本地仓库分支。的时候,会把远程仓库的名字设置为。
2025-06-03 09:53:00
151
原创 将本地的大文件上传到cloud studio
用流量下载是很慢的,用WiFi会稍微快一点,不知道使用以太网会怎么样。小文件直接拖拽即可,大文件拖拽上传就太慢了,于是可以使用下面的方法。下载完毕之后,在本地的Powershell中依次按。然后打开新的Powershell,输入命令。然后打开Powershell,输入命令。对本机使用内网穿透,在云IDE上使用。和Python,然后在云IDE中输入。即可,解压完之后将压缩包删去就OK。在云IDE的终端中输入。首先将这个文件压缩成。
2025-06-02 20:26:00
120
原创 2020期末计网(非重修)
实践报告不一定教给gjg,教给下一学期的课的任课老师;交两份,一份电子版到老师邮箱,主题是“社会实践”还要写上姓名学号,一份纸质版教到老师信箱。不适用无线网络只写隐藏终端(把两种形式都写出来),不要写暴露终端。1.这里说的停等协议就是说一个RTT只有一个包,不然的话有多个包的话肯定结果不一样了。论述题稍微展开一点,不会考挖特别深的问题,比简答题略微多一点即可(为什么怎么办)简答题是什么就答什么,不用多答。2.这里说的RIP就是不考虑毒性逆转的RIP。比如科学发展观是什么,答第二节的六个标题即可。
2025-05-28 11:55:00
187
原创 计算机网络复习
域内路由协议一般是基于性能去设计的,域间路由一般是针对policy实现的。是不是一定要从一开始呢?初始速率的选择对传输速率有什么影响。UDP checksum什么时候是假阳性什么时候是假阴性。慢启动是不是必须的?如果不要了是否还可以正常工作?802.11的频段以及传输速率了解一下就可以了。HHTP每个版本解决了上一个版本的什么问题。怎么理解复用这个概念,为什么每一层都有复用。CDN如何工作来接管DNS中间的解析过程。POP3怎么和安全的电子邮件建立关系。简单网络复杂终端是为了增加可拓展性。
2025-05-28 10:33:00
155
原创 机器学习算法分析数据
函数,喂给Gemini或Claude,让他写出对应模型的网格搜索程序(粒度自己把握),然后再放到Kaggle Notebook上跑。注意对于xgboost来说,最后一定要保存两个文件,一个是模型参数文件,另一个是模型权重文件,这个样子才可以正确载入模型。还有让AI生成的时候,训练和预测的数据处理过程一定要对齐,最好开VScode的对比功能自己看,让AI一直核对是不行的。同时注意,让AI写出训练代码之后,一定要让其在命令行中打出训练进度条,不然的话不知道还有多久才能练完。最好可以检查一下下面的东西齐不齐。
2025-05-27 10:01:00
158
原创 2023期末
两次握手的缺点:可能会将旧的、延迟的连接请求误认为新的请求(见PPT);四次握手的缺点:其实四次握手是客户发SYN,服务器回ACK,然后服务器发SYN,客户会ACK;SYN是请求建立连接,ACK是对SYN的确认;由于服务器收到了客户的SYN就知道了客户是想要连接的,所以没有必要单独发一个SYN去进行请求,可以将ACK和SYN合成一个。注意图里面不是三次重复的ACK:第一个确认是新ACK,后面两个才是重复的,所以一共只有两个重复ACK。1.注意访问完DNS之后,请求对象是要先建立TCP连接的。
2025-05-26 19:02:00
213
原创 2020期末
2.就是B在收到了50字节后就会立马开始传输。注意两条链路的速率是不一样的,所以不一定说B中的缓存的数据一直都是50字节。2.这里说的length就是指的IP首部行中的total length字段。3.虚电路就是专门分配了资源预留带宽,其余与IP的一样。2.这里的子网指的都是CIDR的子网,言之成理即可。1.源/目的MAC,TTL,checksum。3.开放题目,令BE之间的链路开销增大即可。5.就是比较传输时间和24h的大小。
2025-05-25 15:18:00
124
原创 2022计网期末
3.灵活性与兼容性:IP层作为中间层统一了数据交换的标准,允许底层(如以太网、Wi-Fi等)和上层(如HTTP、FTP等)自由演进,只需适配IP协议即可互联。,所以时刻5到时刻6是慢启动,但是立马进入了拥塞避免,然后时刻10到时刻11发生了快恢复但是不是标准的快恢复,忽略了。根据CSMA/CD协议,最长检测时间是信号传播时间的两倍。这一道题目就是注意一下最后一个转发的时候,网桥是不会发到其他局域网里面的。主要是讲一下这个图。在时刻5的时候,发生了超时,于是。注意这是总线,所以传数据都是广播。
2025-05-25 14:05:00
891
原创 关于论文实验结果的阅读
目前来看,肯定是不可以让AI生成的。这无关AI总结要点的能力,而是实验结果可以让你对具体的测试方法有很好地了解。读实验结果,是在精读特别是在准备follow一篇论文的时候,非常关键。
2025-05-25 10:20:00
176
原创 第六次作业
E根据子网掩码发现B与其不在同一个子网,于是E根据DHCP过程中获得的网管路由器的IP地址192.168.3.1,在自己的ARP表中查询其的MAC地址,所以源MAC地址是88-88-88-88-88,目的MAC地址是77-77-77-77-77;在(ii)后,交换机会学习到E的MAC地址,因为在交换机收到来自B的帧之后,会广播这个帧,然后E就会收到,E回复的时候,交换机就会自学习到E的MAC地址;在(i)后,交换机学习到了B的MAC地址,因为在收到来自B的帧的时候,交换机会自学习到B的MAC地址;
2025-05-19 17:37:00
669
原创 Shell 工具和脚本
在这节课中,我们将会展示 bash 作为脚本语言的一些基础操作,以及几种最常用的 shell 工具。到目前为止,我们已经学习了如何在 shell 中执行命令,并使用管道将命令组合使用。但是,很多情况下我们需要执行一系列的操作并使用条件或循环这样的控制流。shell 脚本的复杂性进一步提高。大多数 shell 都有自己的一套脚本语言,包括变量、控制流和自己的语法。shell 脚本与其他脚本语言不同之处在于,shell 脚本针对 shell 所从事的相关工作进行了优化。
2025-05-18 09:28:00
618
原创 shell
作为计算机科学家,我们都知道计算机最擅长帮助我们完成重复性的工作。但是我们却常常忘记这一点也适用于我们使用计算机的方式,而不仅仅是利用计算机程序去帮我们求解问题。在从事与计算机相关的工作时,我们有很多触手可及的工具可以帮助我们更高效的解决问题。但是我们中的大多数人实际上只利用了这些工具中的很少一部分,我们常常只是死记硬背一些如咒语般的命令, 或是当我们卡住的时候,盲目地从网上复制粘贴一些命令。本课程意在帮你解决这一问题。我们希望教会您如何挖掘现有工具的潜力,并向您介绍一些新的工具。
2025-05-18 07:38:00
896
原创 12.6.3 训练
把输入数据显式移动到主设备(也就是第一个 GPU);这样才能正常工作;否则,PyTorch 不知道该从哪里开始分割数据。使用时,你需要确保输入数据已经放在主设备上(如devices[0]),因为会从这个设备开始切分和分发数据。模型副本分布在多个 GPU 上,计算完成后结果会在主设备上合并。
2025-05-17 22:16:00
360
原创 12.3.2 并行计算与通信
的作用是让张量从 GPU 到 CPU 的复制操作变成异步(非阻塞)方式,从而提升性能,但你需要确保在访问数据前调用来等待复制完成。如果你想了解如何利用和 CUDA streams 做更高级的性能优化,我也可以继续深入讲解 😊对于代码with d2l.Benchmark('在GPU1上运行并复制到CPU'):和with d2l.Benchmark('在GPU1上运行并复制到CPU'):后者会更慢,因为。
2025-05-17 20:25:00
816
原创 12.1.3 Sequential的混合式编程
本质上是一个上下文管理器,能够工作的关键在于对象是否实现了上下文管理协议(注意Python中什么都是对象,所以上面那个例子,是一个魔法命令,简单来说就是列出当前目录文件所有以。可以把它看作是一个“自动开关门”的机制。表示保存到当前目录下,文件名为。
2025-05-17 18:36:00
92
原创 12.1.1 符号式编程
调用之间有什么联系,也不会合并它们成一个更高效的计算流程;当你把 Python 的这些小操作映射到 GPU 上执行时,每次函数调用都要把数据从 CPU 内存传送到 GPU 显存,启动一次内核,等待结果返回;这些过程都需要上下文切换和同步等待 ,带来很大的通信和调度开销。函数调用都是独立发生的,Python 不会知道这三个。,所以根本就不用传进去,直接优化成结果,输出。符号式编程比如TensorFlow 1.x。这个样子相当于就知道了整个计算图,然后对于。这个函数,实际上就已经知道了最后的输出是。
2025-05-17 18:13:00
104
原创 Problem Set 7
注意这里每个硬币可以使用无限次,所以必须使用正序循环。背包,所以如果使用滚动数组的话,要使用倒序循环。背包,所以如果使用滚动数组的话,要使用倒序循环。个数,是否可以选出一些数,使得这些数的和为。个数,是否可以选出一些数,使得这些数的和为。,所以不是多项式算法,而是指数级别算法。(a).简单完全背包,代码见下。个字符的LCS,要求X的第。个字符重复出现的次数不超过。由上所述,输入的总规模为。所需要的最小次数,有。边界条件见下面的代码。个硬币,是否能够合成。
2025-05-15 15:56:00
804
原创 Kosaraju 算法的证明
大,想一想后缀遍历的定义即可)。所以我们遍历到的点就是一个强连通分量。这里主要是要用到PPT上提到的两个性质。我们如果从后序遍历中标号最大的点(设为。)在反图上开始遍历,那么这次遍历中,),一定在原图上,可以到达。在原图上一定能到达(否则。是标号最大的点,所以。
2025-05-08 16:19:00
97
原创 Problem Set 6
我们考虑一个朴素的做法:遍历所有非树边,将每条非树边加入到树中,暴力标记形成的环上与非树边权重相同的树边;由于这条树边不是桥边,所以一定存在连接这两个连通块的边,而且这些边是非树边,我们在前面的循环过程中可以遍历到,而这条树边既然没有被打上标记,就说明这些非树边的权重都严格大于这条树边,而去掉这条树边之后。要判断一条树边是不是临界边,就是要判断是否存在一条与其权重相同的非树边,使得加入这条非树边形成的环上包含这条树边。之后,剩余的树不是剩余子图的MST,那么我们将这颗剩余的树换成MST,再加上。
2025-05-08 10:41:00
703
原创 654321
假设函数 $ u(x) $ 在点 $ \mathbb{E}[\widetilde{\omega}] $ 处是光滑的(即具有任意阶导数),我们可以对 $ u(x) $ 在 $ x = \mathbb{E}[\widetilde{\omega}] $ 处进行泰勒展开:\]其中:现在,我们将随机变量 $ \widetilde{\omega} $ 代入 $ u(x) $ 的泰勒展开式中,并对整个表达式取期望:\]由于期望运算符是线性的,我们可以将求和符号和期望运算符交换位置:\]
2025-05-08 07:33:00
210
原创 123456
如果本地 DNS 只知道 TLD 的域名,不知道 IP,怎么发消息给它?当根服务器返回 TLD 的 NS 记录时,它同时也会返回对应的 A/AAAA 记录(Glue Record)。所以本地 DNS 在拿到 TLD 的名字后,一定也知道它的 IP 地址,可以顺利发送请求。
2025-05-05 15:11:00
392
原创 第十六课 卷积神经网络
在2017年的时候,Transformer还没有出来,NLP用的都是LSTM,但是LSTM的深度不能搭建得很深,但是当时的CV可以,所以有人想把CV中的CNN借鉴到NLP里面来,然后就在文本分类任务中搭建了非常深的CNN,叫做VD-CNN,架构如下(注意,图中的。在Transformer出来之前,NLP处理使用的是RNN.RNN得到的信息是关于整个句子的,没有办法获得单个词的信息,如下。的卷积层,与CV中的一样,这相当于一个全连接层,可以用来创建新的特征,如下。注意池化跟CV里面的一样,是按照通道池化的。
2025-05-03 21:10:00
383
原创 StarCoder附录A代码注释
这段代码通过三个正则表达式模式,精准匹配 GitHub Issues 中的自动化邮件内容,并将其过滤,确保训练数据集仅包含高质量的人类技术讨论。这种预处理步骤对代码生成模型(如 StarCoder)的训练至关重要,能够显著提升模型生成代码的实用性和关联性。通过这些规则,The Stack 数据集确保了GitHub Issues部分的数据纯净度。,以确保数据集中仅保留高质量的人类讨论内容。,确保数据集中仅保留人类生成的高质量技术讨论。,其中包含三个预编译的正则表达式模式。这段代码是用 Python 的。
2025-05-01 15:37:00
998
原创 对定理9.1的分析
[-\int_0^1 [F_A(x) - F_B(x)] u'(x) dx \leq 0 \quad \text{(对所有满足条件的 } u \text{ 成立)}$ F_A(x) \leq F_B(x) $ 对任意 $ x \in [0,1] $ 成立,需要结合。选择一个特定的测试函数 $ u_\delta(x) $,其导数 $ u_\delta'(x) $ 是。证明对任意 $ x \in [0,1] $,都有 $ F_A(x) \leq F_B(x) $。收缩为单点 $ x_0 $。
2025-04-30 21:57:00
713
原创 第五次作业
当路由器通过BGP通过前缀时,会包含AS-PATH,当路由器在AS-PATH中看到自己所在的AS的时候,就检测到了环路。不是必要的,因为每个AS都可以决定自己内部运行什么路由选择算法,这就是其自治性的体现。三者之间的关系:前缀包含若干子网;下面的表格中,与教材图5-6一致,列表示终点,行表示起点(只给出z的表)DV:使用迭代、分布式的方式计算最短路,相邻节点之间交换更新信息。子网:互联的主机与路由器接口形成的网络(不包含路由器)前缀:CDIR化的IP地址的若干位最高比特。BGP路由:前缀以及BGP属性。
2025-04-26 21:51:00
340
原创 线性代数的本质
两个向量的叉积定义为这两个向量张成的平行四边形的面积(使用右手法则确定正负号)由于计算面积,所以我们可以利用行列式对于二维向量的叉积,我们将两个向量的坐标分别作为一个的方阵的列向量(注意作为第一列,而作为第二列,这个样子符号就对了),然后计算这个列向量的行列式即可三维空间的叉积,会生成一个新的向量,见视频5:10。
2025-04-26 17:47:00
939
原创 2024算法期中
之间的hash是互不干扰的,而且均匀地hash到每一个位置上。所以是有可能冲突的,但是这里算的是时间复杂度,无所谓。注意这里是用array doubling动态增加内存,所以叫做前两个操作是平摊复杂度。两个栈实现队列的思想,只不过将栈换成普通数组,再拿两个变量记录数组的大小即可。Independent Uniform Hashing就是各个输入。的hash值,看在不在桶里面(注意。行的最小元素,设这个最小元素在第。当然这纯属出题人不是很道德。列中,所有行的最小元素。行,且这些行的最小值在第。
2025-04-23 10:11:00
122
原创 第四次作业
如果不同意,那么就是从IPv4的角度看,其应该是作为网络层协议,因为IPv4是一个网络层协议,IPv6通过IPv4隧道的时候,就是在外面包装了IPv4的首部,这等价于网络层协议。如果同意,那么就是从IPv6的角度看,IPv6是一个网络层协议,其被完全包裹在IPv4首部中,所以IPv4隧道是一个链路层协议。a.观察所有俘获的分组,序号连续的分组来自同一个主机,有多少个不同的开头序号就有多少个主机。分子是文件总大小,分母减去的两个20,一个是TCP的首部长度,另一个是IP的首部长度。
2025-04-21 21:05:00
559
原创 第三章课后习题
即无论你是发送方计算机或者接收方检查校验和时,都不要调用htons或者ntohs,直接通过上面的算法就可以得到正确的结果。一定要注意A和B有序列号(因为有duplicate数据包),所以C要有四个状态;这里按照接收到的数据包是不是来自当前等待的那个主机来分类而不是是否损坏,这是因为这个样子就可以转化成rdt。死锁的题目,就按照FSM中,接收方等的东西和发送方所处的状态不一样,就可以死锁了。答案的意思:首先如果是停等协议的话,超时机制已经够了,不需要再设置。注意,序列号指的是数据的大小,不包含header。
2025-04-18 16:01:00
128
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人