deep learning
文章平均质量分 81
惜君Iris
研究方向:信息安全,数据隐私
展开
-
联邦学习 深度学习对抗攻击
联邦学习本身“联邦学习” 实际上是一种加密的分布式机器学习技术,参与各方可以在不披露底层数据和底层数据的加密(混淆)形态的前提下共建模型。如果机构之间的数据无法互通,一家企业一家机构数据量有限,或者是少数巨头公司垄断大量数据,而小公司很难获得数据,形成大大小小的“数据孤岛”。在这种没有权限获得足够多的用户数据的情况下,各个公司尤其是小公司,如何建模?在这种情况下,“联邦学习”的概...转载 2019-11-24 16:56:48 · 4517 阅读 · 0 评论 -
网络安全中机器学习大合集
目录数据集 论文 书籍 演讲 教程 课程 杂项↑数据集安全相关数据样本集 DARPA 入侵检测数据集 Stratosphere IPS 数据集 开放数据集 NSA 的数据捕获 ADFA 入侵检测数据集 NSL-KDD 数据集 恶意 URL 数据集 多源安全事件数据集 恶意软件训练集 KDD Cup 1999 数据集 Web 攻击载荷 WAF 恶意请求...转载 2019-08-23 13:46:15 · 679 阅读 · 0 评论 -
迁移学习与多任务学习简析
对于深度学习而言,训练网络这一过程是相当乏味的,需要不断根据实验结果调整网络结构和模型。相对于随机初始化后调参而言,有没有更加高效的方式呢?答案是肯定的。一些科研人员发现,将其它训练好的模型重新应用于另外一个任务,或者是将相同的网络模型应用于多任务中,模型性能可能会更好。本文将讨论这两种重要方法——迁移学习(Transfer Learning)和多任务学习(Multi-task Learning)...转载 2019-08-21 16:18:42 · 1518 阅读 · 0 评论 -
多任务学习Multitask Learning与其他学习算法之间的关系
单任务与多任务对比如图1所示:多任务学习(Multitask learning)是迁移学习算法的一种,迁移学习之前介绍过。定义一个一个源领域source domain和一个目标领域(target domain),在source domain学习,并把学习到的知识迁移到target domain,提升target domain的学习效果(performance)。多标签学习(Multil...转载 2019-08-21 15:59:48 · 646 阅读 · 0 评论 -
机器学习之安全数据集
简介本文主要收录安全相关的数据集,适合初创,中小型企业用于训练和验证自己的机器学习的模型,提高准确率和准确度。由于数据集可能比较多,一开始也不能全部列举出来,所以后续会慢慢补充,慢慢增加。数据集每个数据集都会有简单的介绍,内容类型,是否特征化以及适用范围网络流量 主机行为 文件样本KDD 99KDD CUP 99 dataset就是KDD竞赛在1999年举行时采用的...转载 2019-08-20 21:52:37 · 1588 阅读 · 6 评论 -
关于KDD99入侵检测数据集的FAQ
1 KDDCup99网络入侵检测数据集介绍该数据集是从一个模拟的美国空军局域网上采集来的9个星期的网络连接数据,分成具有标识的训练数据和未加标识的测试数据。测试数据和训练数据有着不同的概率分布,测试数据包含了一些未出现在训练数据中的攻击类型,这使得入侵检测更具有现实性。在训练数据集中包含了1种正常的标识类型normal和22种训练攻击类型,如表1-1所示。另外有14种攻击仅出现在测试数据集中...转载 2019-08-20 21:50:20 · 5052 阅读 · 0 评论 -
深入理解RNN和LSTM
循环神经网络(Recurrent Neural Network,RNN) 为什么使用序列模型(sequence model)?标准的全连接神经网络(fully connected neural network)处理序列会有两个问题:1)全连接神经网络输入层和输出层长度固定,而不同序列的输入、输出可能有不同的长度,选择最大长度并对短序列进行填充(pad)不是一种很好的方式;2)全连接神经网络同...转载 2019-07-08 11:21:12 · 1523 阅读 · 0 评论 -
DBN(深度置信网络)
参考文献:http://blog.csdn.net/zouxy09/article/details/8775518具有层次结构的数学算法: 神经网络 到 深度神经网络DNN 限制深度波尔茨曼机 到 深度波尔茨曼机DBM 限制深转载 2014-05-08 19:25:33 · 54776 阅读 · 0 评论 -
深度学习历程回顾
重磅!神经网络浅讲:从神经元到深度学习 LinkinPark 2016-01-14 4:24:25 机器学习 评论(7)图1 人脑神经网络神经网络是一门重要的机器学习技术。它是目前最为火热的研究方向–深度学习的基础。学习神经网络不仅可以让你掌握一门强大的机器学习方法,同时也可以更好地帮助你理解深度学习技术。本文以一种简单的,循序的方式讲解神经网络。适合对神经网络了解转载 2016-10-06 14:20:11 · 2349 阅读 · 1 评论 -
深度学习BP算法 BackPropagation以及详细例子解析
反向传播算法是多层神经网络的训练中举足轻重的算法,本文着重讲解方向传播算法的原理和推导过程。因此对于一些基本的神经网络的知识,本文不做介绍。在理解反向传播算法前,先要理解神经网络中的前馈神经网络算法。前馈神经网络如下图,是一个多层神经网络的简单示意图: 给定一个前馈神经网络,我们用下面的记号来描述这个网络: L:表示神经网络的层数; nl:表示第l层神经元的个数;转载 2016-09-29 19:53:50 · 11566 阅读 · 1 评论 -
深度学习框架的介绍与比较(Caffe, TensorFlow, MXNet, Torch, Theano)
当前比较主流的5种深度学习框架,包括 Caffe, TensorFlow, MXNet, Torch, Theano,并对这些框架进行分析。首先对这些框架进行总览。库名称开发语言速度灵活性文档适合模型平台上手难易Caff转载 2016-11-03 16:59:55 · 1734 阅读 · 0 评论 -
Hadoop & Spark
大数据(Big Data)大数据,官方定义是指那些数据量特别大、数据类别特别复杂的数据集,这种数据集无法用传统的数据库进行存储,管理和处理。大数据的主要特点为数据量大(Volume),数据类别复杂(Variety),数据处理速度快(Velocity)和数据真实性高(Veracity),合起来被称为4V。大数据中的数据量非常巨大,达到了PB级别。而且这庞大的数转载 2016-09-26 19:32:20 · 407 阅读 · 0 评论 -
随机采样(Gibbs,MCMC)
通常,我们会遇到很多问题无法用分析的方法来求得精确解,例如由于式子特别,真的解不出来;一般遇到这种情况,人们经常会采用一些方法去得到近似解(越逼近精确解越好,当然如果一个近似算法与精确解的接近程度能够通过一个式子来衡量或者有上下界,那么这种近似算法比较好,因为人们可以知道接近程度,换个说法,一般一个近似算法被提出后,人们通常都会去考察或寻求刻划近似程度的式子)。本文要谈的随机模拟就转载 2014-05-14 13:32:35 · 1452 阅读 · 0 评论 -
CD(Contrastive Divergence)
一、DBNs是一个概率生成模型,与传统的判别模型的神经网络相对,用于建立一个观察数据和标签之间的联合分布。 二、DBN的训练 CD(Contrastive Divergence)是log-likelihood gradient的近似算法,同时是a successful update rule for traini转载 2014-05-08 19:31:26 · 9196 阅读 · 1 评论 -
ICA(Independent Component Analysis)
独立成分分析(Independent Component Analysis)1. 问题: 1、上节提到的PCA是一种数据降维的方法,但是只对符合高斯分布的样本点比较有效,那么对于其他分布的样本,有没有主元分解的方法呢? 2、经典的鸡尾酒宴会问题(cocktail party problem)。假设在party中有n个人,他们可以同时说话,我们也在房间中一些角落里转载 2014-02-18 20:54:25 · 985 阅读 · 0 评论