程序喵；-CSDN博客

原创 Conda报错ERROR REPORT environment variables: BUNDLED_DEBUGPY_PATH=/root/.vscode-server/extension...

问题是 Conda 激活环境时报了一个 TypeError: expected str, bytes or os.PathLike object, not NoneType 错误。不要在bashrc或者zshrc中使用conda activate。这里 prefix 是 None，导致 join() 报错。Conda环境变量出错, 解决方法。

2025-04-15 20:55:54 479

原创 SySeVR环境配置和可能的问题

顺着输就行了注意ubuntu22.04及以上不再支持python2, 可以装ubuntu20.04uname -mx86-64对应amd64。

2025-03-12 16:12:31 521

原创 Vul-RAG: Enhancing LLM-based Vulnerability Detection via Knowledge-level RAG 论文略读

别的方法图示, 左边是没有RAG, 中间是“Code-based”, 也就是只给LLM相关代码, 右边是Vul-RAG(不给代码, 但是给自然语言描述)index的构建是LLM来提取的, index是自然语言描述的(1)函数语义(2)漏洞成因(3)漏洞补丁差别[也就是原文说的“多维”]用的就是BM25, 和简单的Reranking, 没什么特别的, 检索函数语义的自然语言描述。别的结果: 检索出来的信息能作为高质量解释。一条index的示例。

2025-02-05 02:27:36 860

原创 Retrieval-Augmented Generation for Large Language Models: A Survey——(1)Overview

首篇全面RAG(检索增强生成)综述, 包括RAG的概念和分类, 与ICL(in-context learning), FT(微调)的对比, RAG优化检索(retrieval), 索引(indexing), 生成(generation), 增强(augmentation)的不同方法

2025-01-31 17:29:00 1598

原创 UltraVCS: Ultra-Fine-Grained Variable-Based Code Slicing for Automated Vulnerability Detection论文笔记

期刊TIFS‘24 生成更细粒度的切片

2024-11-06 10:12:53 1206 1

原创 LExecutor: Learning-Guided Execution——论文笔记

FSE‘23

2024-10-22 01:22:11 1091 1

原创软件安全&漏洞挖掘: 基础知识和概念

由RFC2828定义和缺陷(defect), bug的区别是, 缺陷和bug这类错误不一定和安全相关, 比如功能上不符合设计, 逻辑不符合设计, 但是漏洞是和安全相关的, 就是这种错误被利用会导致安全问题(i.e. could be exploited to violate the system’s security policy.)启发式, 把来自程序外部输入的数据统称为source点, 保守的认为含有恶意攻击数据根据机器学习自动标记source和sink手工标注, 重要的API和数据类型标记。

2024-10-16 23:52:29 1139

原创 SCALE:Constructing Structured Natural Language Comment Trees for Software Vulnerability Detect..论文笔记

ISSTA’24 使用PLM融合自然语言丰富代码语义信息

2024-10-16 23:35:02 1229 1

原创 Uncovering the Limits of Machine Learning for Automatic Vulnerability Detection——论文笔记

USENIX Sec‘24

2024-10-10 14:39:52 853 1

原创南京大学《软件分析》李越, 谭添——1. 导论

优点：在选定的精度下能够保证没有bug。这在教程中会详细介绍。缺点：学术门槛相对高。目前已知国内高校公开的课程资料只有北京大学，南京大学，国防科大，吉林大学的，且通俗易懂的教材稀少（详细课程及教材链接见本文末尾作为一门计算机专业的高年级选修课，入门和提高都较困难。

2024-10-09 23:00:08 1509

原创【Fine-Tuning】大模型微调理论及方法, Pytorch&HuggingFace微调实战

大模型微调是指在预训练的大型模型基础上，使用特定数据集进行进一步训练，以适应特定任务或领域。首先收集数据, 分成训练验证测试, 老生常谈, 都2024年了就不多说了预处理: 每种大模型都有特定的输入格式, 要把原始数据转换成预训练大模型认识的数据输入。

2024-10-09 18:59:33 1993

原创 FIRE: Combining Multi-Stage Filtering with Taint Analysis for Scalable Recurring...论文笔记[上]

USENIX Security‘24

2024-10-01 09:19:44 1023 1

原创布隆过滤器 Bloom Filter

简明: 布隆过滤器是一种数据结构, 一种特殊的集合, 提供插入和查询操作。

2024-10-01 09:12:13 1057

原创 FVD-DPM: Fine-grained Vulnerability Detection via Conditional Diffusion Probabilistic Models 论文笔记[上]

USENIX Security‘24 使用Diffusion Model进行漏洞检测, 将漏洞检测定义为图结构下预测漏洞分布的生成式问题

2024-09-30 10:32:19 1319 3

原创 A Learning-Based Approach to Static Program Slicing —— 论文笔记

OOPSLA‘2024

2024-09-29 13:52:56 1704 1

原创依赖管理——Poetry vs Python venv

是python自带的模块, python3才有。

2024-09-20 21:50:19 947

原创正则表达式全解

详解正则表达式的使用

2024-09-20 21:44:45 1598

原创 Docker常用操作速查表

Docker镜像操作, 容器操作命令和Dockerfile的编写

2024-07-11 14:39:49 861 1

原创 Git最常用操作速查表

Git最常用的分支, 暂存库和git团队协作规范

2024-07-11 14:35:35 562

原创【华科网安复试】网络安全——技术与实践刘建伟版重点和笔记

port模式：Client自己指定端口pasv模式：Server相应时会把端口发过去如果两个模式都开着用户自己可以选择的不安全，不加密，无认证，请用SSH协议缺陷：协议缺陷：一片非真正可信的网络，供外部和内网访问，但不能访问内网XXInternetDMZ内网0x00: 单防火墙体系#mermaid-svg-2GR4RMUMd0qj9OCa {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mer

2024-04-21 20:10:23 2961

原创汇编语言递归：计算斐波那契数列前n项和

【代码】汇编语言递归：计算斐波那契数列前n项和。

2024-03-17 19:59:28 698

原创 Internet协议的安全性

根据源地址欺骗（随机伪造，子网伪造，固定伪造）有放大攻击（DNS请求和响应大小远不同），反射攻击(固定伪造)探寻邻居，定期发整张路由表给邻居，然后看情况更新，最后收敛，每个路由器都有完整拓扑。发的是相邻路由器的状态，有变化才发，给全网泛洪，最后拿dijkstra算、Safe reset： cookie，第三次发rst重连，后续不代理。TCP只有基于序号的认证，认证很弱，如果能猜到序号，人家就相信。不是最佳路由，只保证不兜圈子，下层是TCP，有IGP和EGP。DNS污染: 攻击DNS服务器。

2024-03-16 22:57:16 1111

原创【MASM汇编语言快速入门】8086MASM汇编深入理解指令对标志位的影响

汇总了指令对标志位是否影响和如何影响，详细解释了标志位的含义，详细解释了汇编分支跳转指令对标志位的验证方式

2024-03-16 18:29:13 2435

原创【MASM汇编语言快速入门】DOS中断速查表——DOS常用系统功能调用

DOS系统功能调用在中断向量表中的中断号是21h，这也是为什么总是在8086MASM汇编程序中看到`int 21h`这样的语句, 这样的语句就是在调用DOS的功能, 本文介绍DOS提供的功能

2024-03-13 21:56:16 862

原创【MASM汇编快速入门】最简单的汇编helloword与汇编程序框架：MASM伪指令速查表——存储模型和段的定义

MASM提供了一系列简化段定义的伪指令, 这些指令使用起来比王爽书上介绍的完整段定义方式简单, 冗长的完整段定义方式既容易忘记又容易出错, 不适合学习和使用, 在实际上机过程中能减少很多麻烦. 尤其是初学的时候, 很多伪指令都没有学, 为了上机实验新学习的简单指令, 却需要查阅复杂的完整段定义方式写出完整的程序, 用到诸如`segement`, `assume`, `ends`, `mov ax, 4c00h`, `int 21h`之类的伪指令, 很多初学者都不知道是什么意思, 非常麻烦且容易出错.

2024-03-13 21:32:42 2594

i2pinstall_1.7.0.jar

空空如也