- 博客(249)
- 资源 (27)
- 收藏
- 关注
原创 机器学习常用的评估指标(持续更新)
机器学习常用的评估指标分类算法常见的评估指标1、混淆矩阵(Confuse Matrix)2、准确率(Accuracy)3、精确率(Precision)4、召回率(Recall)5、F1 Score6、P-R曲线(Precision-Recall Curve)7、ROC(Receiver Operating Characteristic)金融风控预测类常见的评估指标1、KS(Kolmogorov-Smirnov)2、ROC3、AUC分类算法常见的评估指标1、混淆矩阵(Confuse Matrix)(1
2020-09-20 11:45:13 2912 3
原创 机器学习算法基础:分类模型概念归纳与总结(持续更新)
硬分类,我们直接需要输出观测对应的分类。这类模型的代表为:线性判别分析(Fisher 判别)感知机软分类,产生不同类别的概率,这类算法根据概率方法的不同分为两种生成式(根据贝叶斯定理先计算参数后验,再进行推断):高斯判别分析(GDA)和朴素贝叶斯等为代表GDANaive Bayes判别式(直接对条件概率进行建模):Logistic 回归...
2020-08-17 20:42:41 1977
原创 机器学习算法基础:极大似然估计(MLE)、最大后验概率估计(MAP)、贝叶斯估计区别
概率论、统计学相信大家都有了解或者上课学过,还有不少人认为概率论也就P(A)+P(B)=1P(A)+P(B)=1P(A)+P(B)=1如此简单,包括曾经的我哈,大学概率论满分,也觉得概率论、统计学就那样嘛,不难。但随着深入的学习,概率论、统计学是机器学习的基础。它们构成了机器学习的全部,我们必须非常清晰地分辨它们,找出它们之间的区别。参考blog:机器学习(二十五)— 极大似然估计(MLE)...
2020-04-06 20:58:20 1952
原创 AAAI2022 Data-Centric Robust Learning on ML Models Rank 10/3691(开源代码、做题思路)
吐槽自己:第N次Top10,麻了,何时拿个rk1爽爽!!!初赛:2/3691复试:10/3691AAAI2022 workshop地址:https://advml-workshop.github.io/aaai2022/AAAI2022 workshop接收我们队伍的论文:论文链接开源代码:Github链接...
2022-03-03 11:21:39 821
原创 2021年度总结—四非计算机保研经历(参营:清华网研院、中科大先研院、华师大数据科学院、厦大计算机系、上科大信息学院)
本人背景本科:❌❌大学(非985、非211、非双一流,四非,吃大亏)专业:计算机科学与技术Rank:专业1/245,学院1/593英语:四六级通过,六级飘过(听说硬伤)科研:AI安全、数据挖掘竞赛:阿里、腾讯、CVPR、Geekpwn相关竞赛Top奖项,数学建模、ACM也有一些省奖论文:一篇SCI二作职务:阿里AI安全学生专家小组成员,学校计算机学院创新班AI竞赛组指导入营:清华网研院、中科大先研院、浙大软院、厦门大学计算机系、中南大学计院、华东师范大学数据学院、山东大学计院、中国农业大学
2022-01-01 13:38:37 7957 25
原创 后门防御阅读笔记,Black-box Detection of Backdoor Attacks with Limited Information and Data
论文标题:Black-box Detection of Backdoor Attacks with Limited Information and Data论文单位: THBI Lab, Tsinghua University, Beijing论文作者:Yinpeng Dong, Xiao Yang, Jun Zhu收录会议:ICCV 2021开源代码:未开源有限信息和数据的条件下对后门攻击的黑盒检测(防御)简单总结第一个在计算逆向触发器时,使用无梯度的优化方法。先前的防御手段,计算逆向
2021-10-18 15:35:24 2199
原创 后门防御阅读笔记,GangSweep: Sweep out Neural Backdoors by GAN
论文标题:GangSweep: Sweep out Neural Backdoors by GAN论文单位:Old Dominion University,Norfolk, VA, USA论文作者:Liuwan Zhu,Rui Ning,Cong Wang收录会议:ACM MULTIMEDIA 2020开源代码:https://github.com/nicholasbennet/neural-network-backdoor-removalGangSweep:通过GAN去“扫出“神经后门(防御)
2021-10-18 15:31:02 1219
原创 投毒后门防御阅读笔记,What Doesn‘t Kill You Makes You Robust (er) Adversarial Training against Poisons and Back
论文标题:What Doesn’t Kill You Makes You Robust (er) Adversarial Training against Poisons and Backdoors论文单位:Department of Electrical Engineering and Computer Science,University of Siegen论文作者:Jonas Geiping,Liam Fowl收录会议:预印版开源代码:未开源那些杀不死你的东西会使你更健壮抵御投毒和后门的对
2021-10-18 15:26:44 746
原创 后门防御阅读笔记,Neural Cleanse Identifying and Mitigating Backdoor Attacks in Neural Networks
论文标题:Neural Cleanse Identifying and Mitigating Backdoor Attacks in Neural Networks论文单位:UC Santa Barbara,University of Chicago论文作者:Bolun Wang, Yuanshun Yao,Shawn Shan收录会议:2019 IEEE Symposium on Security and Privacy (S&P)开源代码:https://github.com/bolun
2021-10-18 15:22:44 2410 4
原创 《PostgreSQL技术内幕——原理探索》第4章、第8章笔记
第四、第八章笔记第4章 外部数据包装器FDW是如何执行的总结第八章 缓冲区管理器8.1 概述8.1.1 缓冲区管理器的结构8.1.2 缓冲区标签(buffer_tag)8.1.3 后端进程如何读取数据页8.1.4 页面置换算法8.1.5 刷写脏页8.2 缓冲区管理器的结构第4章 外部数据包装器2003年,SQL标准中添加了一个访问远程数据的规范,称为SQL外部数据管理(SQL/MED)。PostgreSQL在9.1版本开发出了FDW,实现了一部分SQL/MED中的特性。在SQL/MED中,远程服务器上
2021-10-11 15:09:50 584
原创 后门攻击阅读笔记,Graph Backdoor
论文标题:Graph Backdoor论文单位:Pennsylvania State University,Zhejiang University论文作者:Zhaohan Xi,Ren Pang,Shouling Ji收录会议:预印版开源代码:未开源图后门(攻击)简单总结第一个在图神经网络上的后门攻击与之前的工作相比,GTA在很多方面有所不同:面向图:它将触发器定义为特定的子图,包括拓扑结构和描述性特征,为攻击者提供了大量的设计范围;量身定制的输入:它动态地适应触发器到每个图,从而优化攻击
2021-10-06 17:45:01 2331
原创 类似投毒攻击阅读笔记,MANIPULATING SGD WITH DATA ORDERING ATTACKS
论文标题:MANIPULATING SGD WITH DATA ORDERING ATTACKS论文单位:University of Cambridge论文作者:Ilia Shumailov,Zakhar Shumaylov,Dmitry Kazhdan收录会议:预印版开源代码:未开源使用数据排序攻击来操纵SGD(攻击)简单总结一种非常新颖的投毒和后门攻击抓住了SGD的一个漏洞,不需要对数据和模型进行变动,仅仅是更改了输入数据的顺序即可攻击成功。使用数据集:Cifar10,Cifar10
2021-10-06 17:36:45 804 2
原创 后门攻击阅读笔记,Input-aware dynamic backdoor attack
论文标题:Input-aware dynamic backdoor attack论文单位:VinAI Research, Hanoi University of Science and Technology, VinUniversity论文作者:Tuan Anh Nguyen, Tuan Anh Tran收录会议:NIPS2020开源代码:https://github.com/VinAIResearch/input-aware-backdoor-attack-release输入感知的动态的后门攻击
2021-10-06 17:32:18 2693 2
原创 后门防御经典背景文献(综述)
总结:攻击者可以通过修改训练数据和模型参数来将后门嵌入到模型中。因此,大多数针对后门攻击的检测算法都是针对input samples和model parameters,通过恶意输入和良性输入在后门模型中的统计差异来进行区分。防御者对于攻击者生成的带触发器的输入往往是得不到的,所以一般场景下,都是围绕着model parameters去设计防御。Fine-PruningLiu K, Dolan-Gavitt B, Garg S. Fine-pruning: Defending against b
2021-10-06 17:24:39 1828
原创 后门攻击经典背景文献(综述)
总结攻击在各个场景都有体现,比如外包场景、迁移学习、联邦学习等,主要集中于前两个前景,联邦学习的攻击还有待发展。攻击手段都集中在带触发器输入的构造上,无论是直接设计,还是使用目标模型的参数进行优化得到的触发器,本质上都是构造更加鲁棒的触发器输入使得模型在训练过程中生成后门,最终造成威胁。接下来的工作,应该集中在原来的场景下去设计更鲁棒的触发器输入或在新的场景下提出适合的触发器输入。BadNetsGU T, DOLAN-GAVITT B, GARG S. Badnets: Identifying
2021-10-06 17:23:11 3221
原创 《PostgreSQL指南:内幕探索》第三章笔记
第三章 查询处理主要是前面两个部分第一部分就是简历介绍整个查询处理的流程第二部分就是实现查询最优执行计划的步骤,这里会用单表查询作为一个非常简单的例子。分3小节讨论第三部分,以一个更复杂的例子去讨论,多表查询。3.1 概览解析器(Parser)分析器(Analyzer)重写器(Rewriter)计划器(Planner)执行器(Executor)3.1.1 解析器(Parser)解析器基于SQL语句的文本,生成一颗后续子系统可以理解的语法解析树。基于SQL语句的文本,首先经过词法分析
2021-09-30 15:17:09 326
原创 快速阅读《PostgreSQL数据库内核分析》
第一章 PostgreSQL 系统概述简单描述PostgreSQL的来源、特性和应用。要用的话,可以看看数据库的具体命令。第二章 PostgreSQL的体系结构五大部分组成:1、连接管理系统(对操作请求进行处理和分发)2、编译执行系统(实现在物理存储介质中数据的操作)3、存储管理系统(由索引管理器、内存管理器、外存管理器组成,存储和管理物理数据)4、事务系统(对并发访问数据的一致性支持)5、系统表(管理元数据信息)...
2021-09-29 10:54:16 1032
原创 广州大学计算机视觉实验六:车牌识别
实验六 车牌识别目录实验六 车牌识别一、实验目的二、基本要求三、实验软件四、实验内容五、实验过程1、寻找一个合适的数据集。2、处理数据3、选择检测模型4、训练检测模型5、对验证集图片进行检测6、字符识别7、全部代码一、实验目的本实验课程是计算机、智能、物联网等专业学生的一门专业课程,通过实验,帮助学生更好地掌握计算机视觉相关概念、技术、原理、应用等;通过实验提高学生编写实验报告、总结实验结果的能力;使学生对计算机视觉、模式识别实现等有比较深入的认识。1.掌握模式识别中涉及的相关概念、算法。2.
2021-08-02 11:21:46 1698 2
原创 广州大学计算机视觉实验五:简易数字识别
实验五 简易数字识别目录实验五 简易数字识别一、实验目的二、基本要求三、实验软件四、实验内容1. 使用filter bank提取的纹理特征进行最近邻分类2. 使用全连接神经网络进行分类五、实验过程1. 使用filter bank提取的纹理特征进行最近邻分类2. 使用全连接神经网络进行分类一、实验目的本实验课程是计算机、智能、物联网等专业学生的一门专业课程,通过实验,帮助学生更好地掌握计算机视觉相关概念、技术、原理、应用等;通过实验提高学生编写实验报告、总结实验结果的能力;使学生对计算机视觉、模式识
2021-08-02 11:01:05 1681
原创 广州大学计算机视觉实验四:图像分割
实验四 图像分割目录实验四 图像分割一、实验目的二、基本要求三、实验软件四、实验内容五、实验过程1. 通过filter bank提取的纹理特征进行图像分割2.结合像素值与坐标的k-means聚类,进行图像分割3.结合像素值与坐标的mean shift聚类,进行图像分割4.通过graph partition图分割的方式进行图像分割一、实验目的本实验课程是计算机、智能、物联网等专业学生的一门专业课程,通过实验,帮助学生更好地掌握计算机视觉相关概念、技术、原理、应用等;通过实验提高学生编写实验报告、总结
2021-08-02 10:55:14 2414 2
原创 广州大学计算机视觉实验三:图像滤波
实验三 图像滤波目录实验三 图像滤波一、实验目的二、基本要求三、实验软件四、实验内容五、实验过程1、导入库2、选择经典的宇航员图片3、添加椒盐噪声4、对图像进行方框滤波Box Filter5、对图像进行高斯滤波Gaussian Filter6、对图像进行中值滤波7、通过图像梯度提取图像边缘8、对图像进行锐化一、实验目的本实验课程是计算机、智能、物联网等专业学生的一门专业课程,通过实验,帮助学生更好地掌握计算机视觉相关概念、技术、原理、应用等;通过实验提高学生编写实验报告、总结实验结果的能力;使学生
2021-08-02 10:45:44 1134
原创 广州大学计算机视觉实验二:摄像机几何
实验二 摄像机几何目录实验二 摄像机几何一、实验目的二、基本要求三、实验软件四、实验内容1. 世界坐标系点和像素坐标系点的对应2. 验证二者坐标是否线性关系五、实验过程1. 世界坐标系点和像素坐标系点的对应b. 验证二者齐次坐标是否存在线性关系(附加题)一、实验目的本实验课程是计算机、智能、物联网等专业学生的一门专业课程,通过实验,帮助学生更好地掌握计算机视觉相关概念、技术、原理、应用等;通过实验提高学生编写实验报告、总结实验结果的能力;使学生对计算机视觉、模式识别实现等有比较深入的认识。1.掌
2021-08-02 10:22:28 838
原创 广州大学计算机视觉实验一:图像处理入门
实验一 图像处理入门目录实验一 图像处理入门一、实验目的二、基本要求三、实验软件四、实验内容五、实验过程1. 搭建环境2. 尝试简单图像处理添加噪声、去除噪声线性拉伸非线性拉伸,gamma变换非线性拉伸,对数调整一、实验目的本实验课程是计算机、智能、物联网等专业学生的一门专业课程,通过实验,帮助学生更好地掌握计算机视觉相关概念、技术、原理、应用等;通过实验提高学生编写实验报告、总结实验结果的能力;使学生对计算机视觉、模式识别实现等有比较深入的认识。1.掌握模式识别中涉及的相关概念、算法。2.熟
2021-08-02 10:15:34 2268
原创 CVPR2021 安全AI挑战者计划第六期赛道一方案分享20/1681(开源代码、做题思路)
写在前面CVPR2021Workshop比赛平台链接????这个比赛早早就报名了,也是后面才开始肝的,但一直冲不上前排,也是郁闷了好久。之前都是在做Imagenet数据集上的工作,对Cifar10了解比较少,所以也是抱着学习的态度。我的开源链接????给出我本人的本次比赛的全部做题思路,避免后来者踩坑。做题思路的记录初赛排名313.15 提交一份baseline 44.07333.15 把一些迁移黑盒的TI、SIM、Gauss等试了一通,无效果3.16 调整迭代次数和扰动范围
2021-04-22 12:44:48 905
原创 PAT甲级-大整数运算-1024 Palindromic Number解题思路
1024 Palindromic Number (25分)思路这里有三个非常大的坑,数组需要开大一点,不然装不下PAT还有个巨坑,输入就是满足条件,就判断完不需要计算了,牛客网即不存在这种问题大整数相加处理进位普遍存在的一个问题这三个问题在代码中均有体现。代码#include<bits/stdc++.h>using namespace std;int N;//还有一个坑,数组需要开的足够大int A[1005] = {0};int B[1005] = {0};
2021-04-19 00:13:10 129
原创 PAT甲级-大整数运算-1023 Have Fun with Numbers解题思路
1023 Have Fun with Numbers (20 分)思路大整数翻倍,利用字符串读入,存进数组翻倍即可代码#include<bits/stdc++.h>using namespace std;int A[25];int B[25]={0};int C[25]={0};int main(){ string s; bool flag = true; cin>>s; int len = s.size(); for(
2021-04-18 19:36:16 162
原创 PAT甲级-二叉查找树-1099 Build A Binary Search Tree解题思路
1099 Build A Binary Search Tree (30 分)思路给出树的关系,使用静态写法写好树然后给出一串数字,填进这颗二叉查找树,二叉查找树特点:中序遍历的数字顺序为升序,对数字排序好,利用中序遍历填进去,然后使用BFS输出层次遍历。代码#include<bits/stdc++.h>using namespace std;const int maxn = 110;struct node{ int data; int left,right;
2021-04-17 23:56:48 163
原创 PAT甲级-二叉查找树-1064 Complete Binary Search Tree解题思路
1064 Complete Binary Search Tree (30 分)思路完全查找二叉树的中序遍历是从小到大的;还有一个性质就是,完全二叉树的下标,可以用爸爸的下标表示,分别为2n,2n+1代码#include<bits/stdc++.h>using namespace std;int N;const int maxn = 1010;int Array[maxn];int CBT[maxn];int start = 0;//完全查找二叉树的中序遍历是从小到大的
2021-04-17 18:45:16 172
原创 PAT甲级-二叉查找树-1043 Is It a Binary Search Tree解题思路
1043 Is It a Binary Search Tree (25 分)思路构造二叉查找树需要不断插入,使用动态建树方法而比较序列,vector比较存储的序列更方便镜像二叉查找树 和 之前1102的二叉树的遍历类似,这次我们不需要重复构造,二叉树和二叉树的翻转的区别就是 原版的先序遍历为翻转版本的后序遍历的逆序,原版的后序遍历为翻转版本的先序遍历的逆序,原版的中序遍历为翻转版本的中序遍历的逆序。层序遍历,就是每一层的逆序,掌握这个方法,也可以输出翻转版本的对应序列。代码#include
2021-04-17 18:17:14 194
原创 PAT甲级-树的遍历-1053 Path of Equal Weight解题思路
1053 Path of Equal Weight (30 分)思路PAT还是很严谨的,有个sort的id写成了i,PAT一直有个测试点没过,但牛客网可以过,太坑了。。这里有个sort,对结构体的vector进行排序,非常妙,用到了node里面的权重值对vector排序代码#include<bits/stdc++.h>using namespace std;const int maxn = 110;struct node{ int weight; vecto
2021-04-16 20:26:25 225
原创 PAT甲级-树的遍历-1004 Counting Leaves解题思路
1004 Counting Leaves (30 分)思路数每一层的叶子结点,秒杀代码#include<bits/stdc++.h>using namespace std;const int maxn = 110;int N,K;vector<int> vec[maxn];int num[maxn]={0};int max_depth = 0;void DFS(int index ,int depth){ max_depth = max(max
2021-04-16 17:52:42 114
原创 PAT甲级-树的遍历-1106 Lowest Price in Supply Chain解题思路
1106 Lowest Price in Supply Chain (25 分)思路秒杀不解释代码#include<bits/stdc++.h>using namespace std;const int maxn = 100010;vector<int> Node[maxn];int N;double P,r;int min_depth = maxn;int min_num = 0;void DFS(int index ,int depth){
2021-04-16 15:16:36 140 2
原创 PAT甲级-树的遍历-1094 The Largest Generation解题思路
1094 The Largest Generation (25 分)思路统计哪一层的结点个数最多,也是用DFS搜索即可。测试点只输入一个结点,在树的题目中应该会经常出现~for(int i=1;i<=N;i++) //判断根结点的一个方法,i<N,使用N会报段错误,但i<=N则正确,说明存在只输入一个根结点的情况,小细节 if(!vecbool[i]) {root = i;}代码#include<bits/stdc++.h&g
2021-04-16 01:38:13 228
原创 PAT甲级-树的遍历-1079 Total Sales of Supply Chain解题思路
1079 Total Sales of Supply Chain (25 分)思路1090的升级版,当结点带有数据信息时,需额外补充一个data进行存储。代码#include<bits/stdc++.h>using namespace std;const int maxn = 100010;struct node{ int data; vector<int> child;}Node[maxn];int N;double P,r;doub
2021-04-15 22:34:57 111
原创 PAT甲级-树的遍历-1090 Highest Price in Supply Chain解题思路
1090 Highest Price in Supply Chain (25 分)思路树的构造,肯定要设计一个结点数组,记录他的儿子了,二叉树就两个就固定设置两个int记录下标即可;别的树的儿子不固定,所以就使用vector数组进行存储。这些都是树的静态写法,因为给定了每个每个结点的儿子们,如果没给,类似于二叉树那种重构二叉树就需要使用动态写法了。这里搜树最深几层用到了DFS算法。代码#include<bits/stdc++.h>using namespace std;con
2021-04-15 21:51:03 108
原创 PAT甲级-二叉树的遍历-1102 Invert a Binary Tree解题思路
1102 Invert a Binary Tree (25 分)思路翻转二叉树后序遍历翻转即可,由于给出每个结点的左右儿子,所以这里用到二叉树的静态写法更加方便代码#include<bits/stdc++.h>using namespace std;const int maxn = 30;struct node{ //二叉树的静态写法,更简单实现 int lchild,rchild;}Node[maxn];bool isRoot[maxn]={false}
2021-04-08 15:36:33 232
原创 PAT甲级-二叉树的遍历-1086 Tree Traversals Again解题思路
1086 Tree Traversals Again (25 分)思路题目还是有点抽象的获得先序和中序后,构造树,输出后序遍历代码#include<bits/stdc++.h>using namespace std;const int N = 50;int pre[N],in[N],post[N];int n;struct node{ int data; node* left; node* right;};node* create(int
2021-04-07 22:11:04 126
原创 PAT甲级-二叉树的遍历-1020 Tree Traversals解题思路
1020 Tree Traversals (25 分)思路由后序遍历、中序遍历先构造出整颗树,再得到层次遍历一定要两个遍历才可以得到整颗树,而且一定要有中序遍历(因为可以判断结点位于左子树、右子树),然后带上另一个遍历。构造树使用递归;先、中、后序遍历都是递归;层次遍历是BFS代码#include<bits/stdc++.h>using namespace std;const int maxn =50 ;int pre[maxn],in[maxn],post[maxn]
2021-04-07 17:01:27 209
广州大学计算机视觉实验.zip
2021-08-02
机器学习与数据挖掘实验报告.zip
2021-01-27
人工智能实验报告.zip
2021-01-27
广州大学2020操作系统课程设计——二级文件系统设计.zip
2020-07-25
广州大学操作系统实验报告五份全集.zip
2020-07-24
广州大学2020操作系统PPT以及课后习题答案.zip
2020-07-24
负面词汇(情感分类).csv
2020-02-27
正面词汇(情感分析).csv
2020-02-27
stopwords.txt
2020-02-27
wujiekd学习天气预报.csv
2020-01-20
计算机组成与系统结构的实验软件
2019-12-01
冈萨雷斯.7z
2019-07-16
绘制直方图折线图.7z
2019-07-16
MFC学生成绩管理系统(功能全面版)
2019-07-10
MFC学生成绩管理系统(wujiekd是我博客名字~)
2019-06-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人