- 博客(60)
- 资源 (1)
- 收藏
- 关注
原创 Conda报错ERROR REPORT environment variables: BUNDLED_DEBUGPY_PATH=/root/.vscode-server/extension...
问题是 Conda 激活环境时报了一个 TypeError: expected str, bytes or os.PathLike object, not NoneType 错误。不要在bashrc或者zshrc中使用conda activate。这里 prefix 是 None,导致 join() 报错。Conda环境变量出错, 解决方法。
2025-04-15 20:55:54
191
原创 SySeVR环境配置和可能的问题
顺着输就行了注意ubuntu22.04及以上不再支持python2, 可以装ubuntu20.04uname -mx86-64对应amd64。
2025-03-12 16:12:31
409
原创 Vul-RAG: Enhancing LLM-based Vulnerability Detection via Knowledge-level RAG 论文略读
别的方法图示, 左边是没有RAG, 中间是“Code-based”, 也就是只给LLM相关代码, 右边是Vul-RAG(不给代码, 但是给自然语言描述)index的构建是LLM来提取的, index是自然语言描述的(1)函数语义(2)漏洞成因(3)漏洞补丁差别[也就是原文说的“多维”]用的就是BM25, 和简单的Reranking, 没什么特别的, 检索函数语义的自然语言描述。别的结果: 检索出来的信息能作为高质量解释。一条index的示例。
2025-02-05 02:27:36
534
原创 Retrieval-Augmented Generation for Large Language Models: A Survey——(1)Overview
首篇全面RAG(检索增强生成)综述, 包括RAG的概念和分类, 与ICL(in-context learning), FT(微调)的对比, RAG优化检索(retrieval), 索引(indexing), 生成(generation), 增强(augmentation)的不同方法
2025-01-31 17:29:00
1349
原创 UltraVCS: Ultra-Fine-Grained Variable-Based Code Slicing for Automated Vulnerability Detection论文笔记
期刊TIFS‘24 生成更细粒度的切片
2024-11-06 10:12:53
925
1
原创 软件安全&漏洞挖掘: 基础知识和概念
由RFC2828定义和缺陷(defect), bug的区别是, 缺陷和bug这类错误不一定和安全相关, 比如功能上不符合设计, 逻辑不符合设计, 但是漏洞是和安全相关的, 就是这种错误被利用会导致安全问题(i.e. could be exploited to violate the system’s security policy.)启发式, 把来自程序外部输入的数据统称为source点, 保守的认为含有恶意攻击数据根据机器学习自动标记source和sink手工标注, 重要的API和数据类型标记。
2024-10-16 23:52:29
920
原创 SCALE:Constructing Structured Natural Language Comment Trees for Software Vulnerability Detect..论文笔记
ISSTA’24 使用PLM融合自然语言丰富代码语义信息
2024-10-16 23:35:02
1013
1
原创 Uncovering the Limits of Machine Learning for Automatic Vulnerability Detection——论文笔记
USENIX Sec‘24
2024-10-10 14:39:52
767
1
原创 南京大学《软件分析》李越, 谭添——1. 导论
优点:在选定的精度下能够保证没有bug。这在教程中会详细介绍。缺点:学术门槛相对高。目前已知国内高校公开的课程资料只有北京大学,南京大学,国防科大,吉林大学的,且通俗易懂的教材稀少(详细课程及教材链接见本文末尾作为一门计算机专业的高年级选修课,入门和提高都较困难。
2024-10-09 23:00:08
1350
原创 【Fine-Tuning】大模型微调理论及方法, Pytorch&HuggingFace微调实战
大模型微调是指在预训练的大型模型基础上,使用特定数据集进行进一步训练,以适应特定任务或领域。首先收集数据, 分成训练验证测试, 老生常谈, 都2024年了就不多说了预处理: 每种大模型都有特定的输入格式, 要把原始数据转换成预训练大模型认识的数据输入。
2024-10-09 18:59:33
1715
原创 FIRE: Combining Multi-Stage Filtering with Taint Analysis for Scalable Recurring...论文笔记[上]
USENIX Security‘24
2024-10-01 09:19:44
952
1
原创 FVD-DPM: Fine-grained Vulnerability Detection via Conditional Diffusion Probabilistic Models 论文笔记[上]
USENIX Security‘24 使用Diffusion Model进行漏洞检测, 将漏洞检测定义为图结构下预测漏洞分布的生成式问题
2024-09-30 10:32:19
1081
2
原创 A Learning-Based Approach to Static Program Slicing —— 论文笔记
OOPSLA‘2024
2024-09-29 13:52:56
1570
1
原创 【华科网安复试】网络安全——技术与实践 刘建伟版 重点和笔记
port模式:Client自己指定端口pasv模式:Server相应时会把端口发过去如果两个模式都开着用户自己可以选择的不安全,不加密,无认证,请用SSH协议缺陷:协议缺陷:一片非真正可信的网络,供外部和内网访问,但不能访问内网XXInternetDMZ内网0x00: 单防火墙体系#mermaid-svg-2GR4RMUMd0qj9OCa {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mer
2024-04-21 20:10:23
2072
原创 Internet协议的安全性
根据源地址欺骗(随机伪造,子网伪造,固定伪造)有放大攻击(DNS请求和响应大小远不同),反射攻击(固定伪造)探寻邻居, 定期发整张路由表给邻居,然后看情况更新, 最后收敛,每个路由器都有完整拓扑。发的是相邻路由器的状态, 有变化才发, 给全网泛洪, 最后拿dijkstra算、Safe reset: cookie, 第三次发rst重连,后续不代理。TCP只有基于序号的认证,认证很弱,如果能猜到序号,人家就相信。不是最佳路由,只保证不兜圈子,下层是TCP, 有IGP和EGP。DNS污染: 攻击DNS服务器。
2024-03-16 22:57:16
1053
原创 【MASM汇编语言快速入门】8086MASM汇编深入理解指令对标志位的影响
汇总了指令对标志位是否影响和如何影响, 详细解释了标志位的含义, 详细解释了汇编分支跳转指令对标志位的验证方式
2024-03-16 18:29:13
2247
原创 【MASM汇编语言快速入门】DOS中断速查表——DOS常用系统功能调用
DOS系统功能调用在中断向量表中的中断号是21h,这也是为什么总是在8086MASM汇编程序中看到`int 21h`这样的语句, 这样的语句就是在调用DOS的功能, 本文介绍DOS提供的功能
2024-03-13 21:56:16
741
原创 【MASM汇编快速入门】最简单的汇编helloword与汇编程序框架:MASM伪指令速查表——存储模型和段的定义
MASM提供了一系列简化段定义的伪指令, 这些指令使用起来比王爽书上介绍的完整段定义方式简单, 冗长的完整段定义方式既容易忘记又容易出错, 不适合学习和使用, 在实际上机过程中能减少很多麻烦. 尤其是初学的时候, 很多伪指令都没有学, 为了上机实验新学习的简单指令, 却需要查阅复杂的完整段定义方式写出完整的程序, 用到诸如`segement`, `assume`, `ends`, `mov ax, 4c00h`, `int 21h`之类的伪指令, 很多初学者都不知道是什么意思, 非常麻烦且容易出错.
2024-03-13 21:32:42
2370
原创 【MASM汇编语言快速入门】MASM常用伪指令速查表——变量
一篇文章系统的解决所有与变量相关的MASM伪指令, 如MASM的db指令, dup指令等常用的与变量定义相关的汇编伪指令
2024-03-13 16:29:37
2308
原创 不同汇编语言的对比
在学习汇编语言的过程中, 我们会听到很多很多关于汇编语言的名词, 比如NASM汇编, AT&T风格汇编, ARM汇编, 而大多国内教材教授的都是基于x86平台的MASM汇编语言, 由于缺少对其他汇编语言的介绍, 我们学习完教材后仍然对其他汇编语言的概念和名词不太了解, 导致见到这些名词时一头雾水, 本文旨在通过整理各种资料解释这些名词的含义及区别
2024-02-27 18:24:17
2593
原创 CMake Error: Cannot determine link language for target “xxx“.【已解决】
【已解决】
2022-12-21 23:54:02
4656
1
原创 深度学习 —— 深度理解归一化和BatchNorm(理论部分)
BatchNorm算子理论部分, 还有归一化的前置知识介绍, 后期会更新代码实践部分
2022-07-18 21:49:59
578
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人