![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
大青呐
精神的锐利不可能产生于舒适的环境中。
展开
-
恶意代码检测
恶意代码定义恶意代码也称为恶意软件,是对各种敌对和入侵软件的概括性术语。包括各种形式的计算机病毒、蠕虫、特洛伊木马、勒索软件、间谍软件、广告软件以及其他的恶意软件。恶意代码的种类计算机病毒:指寄居在计算机系统中,在一定条件下被执行会破坏系统、程序的功能和数据,影响系统其他程序和自我复制。蠕虫:也算是一种病毒,它具有自我复制能力并通过计算和网络的负载,消耗有限资源。特洛伊木马:也...翻译 2019-12-15 14:08:32 · 4365 阅读 · 1 评论 -
机器学习 | 简单线性回归和最小二乘法
最近一段时间在学习机器学习算法,看了一些视频,打算整理下做成笔记,方便以后看。线性回归:能够用一个直线比较精确地描述数据之间的关系,当出现新的数据的时候,能够预测出一个简单的值。线性回归算法主要来解决回归问题,本身思想简单,容易实现,是许多强大的非线性墨香的基础,而且结果比较直观好解释。目标:寻找一条直线,最大程度的“拟合”样本特征和样本输出标记之间的关系。如图假设找到了最佳拟合直...原创 2019-10-23 11:24:47 · 290 阅读 · 0 评论 -
Web安全之机器学习 | 决策树与随机森林算法
决策树算法1、决策树算法概述决策树表现了对象属性与对象值之间的一种映射关系。决策树中每个节点表示某个对象,而每个分叉路径则代表某个可能的属性值,每个叶节点则对应从根节点到该叶节点所经历的路径所表示的对象值。决策树可以用于数据分类也可以用于预测。例如:from sklearn import treeX = [[0, 0], [1, 1]]Y = [0, 1]clf = t...原创 2019-08-12 15:44:09 · 823 阅读 · 0 评论 -
K近邻算法检测异常操作及病毒
1、简介K邻近算法(K-Nearest Neighbor,KNN),就是K个最近的邻居的意思,就是说每个样本都可以用它最接近的K个邻居来代表。KNN算法的核心是,如果一个样本在特征空间中的K个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。KNN常用的算法:Brute Force、K-D Tree、Ball Tree.2、一个简单示例用...原创 2019-08-11 17:02:51 · 1593 阅读 · 1 评论 -
ImportError: cannot import name 'cross_validation'解决
在学习KNN算法检测异常操作,在效果验证中,使用交叉验证时,调用了cross_validation函数,结果在编译时报错。经过查看知道sklearn在0.02版本后改变了cross_validation函数(https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.cross_validate.htm...原创 2019-08-11 15:49:38 · 5871 阅读 · 1 评论 -
Web安全之机器学习 | 朴素贝叶斯算法
1、朴素贝叶斯算法概述贝叶斯分类是一系列分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。其中朴素贝叶斯(Naive Bayesian,NB)是其中应用最广泛的分类算法之一。通常企业和大型邮件服务商都会提供拦截垃圾的功能,最常见的一种算法就是基于朴素贝叶斯的文本分类算法,大体思路是通过学习大量的垃圾邮件和正常邮件样本,让朴素贝叶斯训练出文本分类模型。NB算法是基于贝叶斯定理...原创 2019-08-13 18:19:18 · 454 阅读 · 0 评论 -
机器学习笔记 | multivariate linear regression(多元线性回归)
设置编程环境Octave是一个自由的,开放源码可以在许多平台的应用。它有一个文本界面和实验的图形之一。MATLAB是专有软件,但免费的试用许可到MATLAB在线注册账户。MATLAB在线:https://matlab.mathworks.com/在windows安装Octave: http://wiki.octave.org/Octave_for_Microsoft_Windows...原创 2019-07-28 12:31:19 · 3232 阅读 · 0 评论 -
机器学习笔记 | Linear Algebra Review(复习线性代数)
1、矩阵和向量(Matrices and Vectors)上面矩阵A是一个4x 2矩阵,Aij ,下标i j分别对应矩阵的第i行和第j列 。一个有'n'行的向量被称为'n'维向量。vi表示向量第i行中的元素。一般情况下,所有的向量和矩阵都是从1-开始索引的。矩阵一般用大写字母表示,向量一般用小写字母表示。标量是一个单个值,不是向量或矩阵。R是实数的集合,Rn...原创 2019-07-28 09:50:32 · 420 阅读 · 0 评论 -
机器学习笔记 | Model and Cost Function(模型表示和代价函数)
1、模型表示监督学习是对于每个数据,给出了正确的答案。对于上面房价预测列子来说,根据我们给的数据,房子的实际价格是多少。预测出的是一个准确的输出值。监督学习中,数据集被称为训练集。m :表示训练样本的数量x :表示输入变量,也被称为特征值y :表示输出变量或目标变量(x,y) :表示一个训练样本,为了表示某个训练样本,可使用x(i)和y(i)具体表示,其中i是...原创 2019-07-28 09:50:09 · 677 阅读 · 0 评论 -
Web安全之机器学习 | 学习工具之Python和TensorFlow
Python在机器学习领域的优势:1、NumPy:NumPy是Python的一种开源的数组计算扩展。可用来存储和处理大型矩阵。提供了许多高级的数值编程工具,如:矩阵数据类型、矢量处理、以及精密的运算库,专门为进行严格的数字处理。NumPy包括:一个强大的N维数组对象Array;比较成熟的(广播)函数库;用于整合C/C++和Fortran代码的工具包;实用的线性代数、傅...原创 2019-08-01 18:05:58 · 275 阅读 · 0 评论 -
机器学习笔记 | Supervised Learning and Unsupervised Learning(监督学习和无监督学习)
趁着开学前,计划入门机器学习,选择了coursera吴恩达老师的机器学习课程。(如果打开视频看不了解决方法访问:https://www.cnblogs.com/marsggbo/p/7625575.html)1、初识机器学习机器学习的应用已经渗透了很多方面,如google搜索引擎苹果的图片识别,垃圾邮件过滤器,淘宝的推荐等等。两种提出的机器学习的定义:Arthur Samuel...原创 2019-07-28 09:43:58 · 1080 阅读 · 0 评论 -
Web安全之机器学习 | 数据集和特征值提取
数据集1、KDD 99数据KDD是知识发现与数据挖掘(Knowledge Discovey and Data Mining)的简称。2、HTTP DATASET CSIC 2019HTTP DATASET CSIC 2019包含大量标注过的针对web服务器的36000个正常请求及25000个攻击请求,攻击类型包括sql注入、缓冲区溢出、信息泄露、文件包含、xss等,被广泛用于WAF...原创 2019-08-05 11:48:31 · 2702 阅读 · 0 评论