![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
木杉Vincent
这个作者很懒,什么都没留下…
展开
-
深度学习知识点盘点(一)
最近博主在学习深度学习,选择的是看吴恩达的DeepLearning课程,因为Coursera上完成课程要申请助学金不然要钱(白嫖警告),并且要完成作业。博主没那么多时间也没那么多钱,所以选择了b站上刷视频。刷视频的时候就边看边作总结,本来找了一些比较著名的笔记,一看发现还是字幕比较多,不利于复习,所以对部分常用的深度学习概念做了一些知识点盘点,然后又决定发到博客上,所以我尽量以看得懂的形式记录,希...原创 2019-12-12 22:31:29 · 1093 阅读 · 0 评论 -
Stanford 机器学习(吴恩达)课程小笔记
机器学习的定义 “A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with exper...原创 2018-12-28 16:23:09 · 1145 阅读 · 0 评论 -
推荐系统 recommender system
使用场景 消费者C={user1,user2,user3,…,usernu}C=\{user_1,user_2,user_3,\dots,user_{n_u}\}C={user1,user2,user3,…,usernu},一共有nun_unu个样本 商品G={prod1,prod2,…,prodnp}G=\{prod_1,prod_2,\dots,prod_{n_p}\}G={pro...原创 2018-12-21 21:33:17 · 1024 阅读 · 0 评论 -
异常检测 anomaly detection
异常检测的应用 欺诈检测 工业质量监测 计算机集群监测 等等 定义 给定一些数据集D={x1,x2,…,xm}D=\{x_1,x_2,\dots,x_m\}D={x1,x2,…,xm},注意这些样本是unlabel的,构建一个模型p(x)p(x)p(x),对于一个新的样本xtestx_{test}xtest,判断该样本是否异常。当p(xtest)≤ϵp(x_{test})\le \ep...原创 2018-12-21 21:17:58 · 1436 阅读 · 0 评论 -
K近邻聚类算法
概述 随机选择K个聚类中心,在每一次迭代中,先为每个点确定其最近的聚类中心,这一步称为集群分配(cluster assignment),然后计算每个类中所有点的中心点,将该类的聚类中心移动到中心点,这一步称为中心移动(move centroid),得到这k个聚类中心的新位置,进行下一次迭代,直到每个聚类中心点正确分布在每个类的中心。 算法的输入有两个参数:聚类中心的数量K和一系列训练集X={x1,...原创 2018-12-10 21:04:09 · 5211 阅读 · 0 评论 -
神经网络初步与反向传播算法
层数表示 输入数据的层叫输入层(input layer) 输出结果的层叫输出层(output layer) 除了这两层之外的层都叫隐藏层(hidden layer) 激活函数 每个结点的激活函数,通常都是sigmoid函数 g(x)=11+e−x g(x)=\frac{1}{1+e^{-x}} g(x)=1+e−x1 表示方法denote 通常,上标表示层数,下标表示该层的第几个。 在输入层,输...原创 2018-11-16 16:49:25 · 815 阅读 · 0 评论 -
逻辑回归 logistic regression 算法原理及优化
概述 逻辑回归也叫对数几率回归 “逻辑回归”虽然叫回归,但是却是一种分类方法,跟线性回归(linear regression)有着显著的不同。 优点:无需事先假设数据分布,可以避免假设分布不准确带来的问题;不是预测出类别,而是给出近似概率;对率函数是任意阶可导的凸函数,有很好的数学性质。 缺点: 算法推导 给定训练数据集D={(xi,yi)}i=1mD=\{(x_i,y_i)\}_{i=1}...原创 2018-11-13 16:49:31 · 2726 阅读 · 0 评论 -
K最近邻(k-Nearest Neighbor,KNN)分类算法
概述 K最近邻(k-Nearest Neighbor,KNN)分类算法是最简单的机器学习算法。 它没有训练的过程,它的学习阶段仅仅是把样本保存起来,等收到测试集之后再进行处理,属于“懒惰学习”。反之,在训练阶段就对样本进行学习的算法属于“急切学习”。 它本质上是衡量样本之间的相似度。 口头描述 给定测试集里某个点,基于某种距离度量计算它与训练集中每个点的距离,按照距离递增依次排序,选取与当前点距离...原创 2018-10-22 13:08:41 · 1090 阅读 · 0 评论 -
线性回归 linear regression 原理及推导
概述 优点:容易计算,易于理解和实现 缺点:容易欠拟合 适用数据类型:数值型和标称型 口头描述 线性回归试图构造一个线性函数,去拟合尽可能多的样本点。重点是如何确定线性函数的参数,使得该函数尽量穿过样本点,一般使用均方误差最小化来作为参数拟合效果的标准。 算法推导(解方程的方法) 给定训练数据集D={(xi,yi)}i=1mD=\{(x_i,y_i)\}_{i=1}^mD={(xi,yi...原创 2018-10-22 13:04:34 · 855 阅读 · 0 评论 -
SVM支持向量机算法原理
特点概述 优点: 泛化性能好,计算复杂度低,结果容易解释 缺点: 对参数和核函数选择敏感,原始分类器不加修改仅适用于二分类问题 适用数据类型:数值型和标称型数据 口头描述 SVM认为可以使用一个超平面将数据集分隔开来,距离超平面最近的点称为支持向量,SVM的目标是确定超平面使得支持向量到它的距离最大化。求解的算法有很多种,一般使用SMO算法, 它将大优化问题转化为小优化问题进行求解。 SVM推...原创 2018-10-06 19:54:46 · 633 阅读 · 0 评论