机器学习
胖虎卖汤圆
上海科技大学硕士
展开
-
MachineLearning_SVM
一.凸规划1.凸集设集合S⊂Rn,若S中任意两点连线仍属于S,则S称为凸集,即设集合S⊂ℝ^n,若S中任意两点连线仍属于S,则S称为凸集,即设集合S⊂Rn,若S中任意两点连线仍属于S,则S称为凸集,即x1+λ(x2−x1)∈Sx_1+λ(x_2−x_1)∈Sx1+λ(x2−x1)∈S2.凸函数设S为Rn上的非空凸集,f是定义在S上的实函数,若对任意x1,x2∈S,及λ∈(0,...原创 2020-03-02 22:27:15 · 347 阅读 · 0 评论 -
MachineLeaning_PCA
主成分分析法一、PCA简介1.基本概念主成分分析(Principal Component Analysis, PCA)是研究如何将多指标问题转化为较少的综合指标的一种重要的统计方法,它能将高维空间的问题转化到低维空间去处理,使问题变得比较简单、直观,而且这些较少的综合指标之间互不相关,又能提供原有指标的绝大部分信息。PCA是一个无监督问题,不是基于标签,而是基于方差。我们可以认为原始的数据...原创 2020-01-08 20:58:52 · 289 阅读 · 0 评论 -
MachineLearning_FP-growth
一、FP-growth介绍从大规模的数据集中,寻找不同特征或者物品之间的隐含关系,称为关联分析(association analysis),或者关联规则学习(association rule learning)。在 Apriori 算法中,寻找频繁项集,需要对每一个可能的频繁项扫描一遍数据集计算支持度,计算量庞大。在 FP-growth 算法中,寻找频繁项集,只需要扫描两遍数据集,将数据存储...原创 2019-12-31 17:44:16 · 116 阅读 · 0 评论 -
MachinLearning_Apriori
一.Apriori从大规模数据集中寻找物品间的隐含关系被称作关联分析(association analysis)或者关联规则学习(association rule learning)。那么什么是关联分析呢?关联分析是一种在大规模数据集中寻找有趣关系的任务。这些任务包括两项:发现频繁项集和从频繁项集中发现关联规则。频繁项集(frequent item sets):是经常出现在一块的物品的集...原创 2019-12-22 20:33:27 · 156 阅读 · 0 评论 -
MachinLearning_Cluster
一.无监督学习聚类算法:第一个无监督学习算法(无标签的数据)什么是无监督学习?对比:监督学习问题指的是,我们有一系列标签,然后用假设函数去拟合它,作为对比,在无监督学习中,我们的数据并没有任何标签,无监督学习要做的就是将这系列没有标签的数据输入到算法中,然后我们要让算法找到隐含在数据中的结构。例如聚类算法,当然还有一些其他的无监督学习算法,而不单单是簇。在这里我们有一系列点,却没有标签。...原创 2019-12-22 19:53:06 · 298 阅读 · 0 评论 -
MachineLearning_Regression
一.线性回归线性回归形式简单、易于建模,但却蕴涵着机器学习中一些重要的基本思想。许多功能更为强大的非线性模型(nonlinear model)可在线性模型的基础上通过引入层级结构或高维映射而得。此外,由于线性回归的解????直观表达了各属性在预测中的重要性,因此线性回归有很好的可解释性。1.线性回归原理线性回归遇到的问题一般是这样的。我们有????个样本,每个样本对应于????维特征和一个结果输出。训练...原创 2019-12-15 18:03:35 · 195 阅读 · 0 评论 -
MachineLearning_AdaBoost
AdaBoost基本原理介绍一. AdaBoost分类问题以二分类为例,假设给定一个二类分类的训练数据集χ={(x1,y1),(x2,y2),...,(xn,yn)},\chi = \left \{ (x_{1}, y_{1}), (x_{2}, y_{2}),...,(x_{n}, y_{n})\right \},χ={(x1,y1),(x2,y2),...,(xn,yn)},其...原创 2019-12-14 12:57:35 · 158 阅读 · 0 评论 -
MachineLearning_NoiveBayes
朴素贝叶斯(Naive Bayes)是一种简单的分类算法。一、朴素贝叶斯的理论基础给定训练数据集(X,Y),其中每个样本x都包括n维特征,即x=(x1,x2,x3,…,xn),类标记集合含有k种类别,即y=(y1,y2,…,yk)。如果现在来了一个新样本x,我们要怎么判断它的类别?从概率的角度来看,这个问题就是给定x,它属于哪个类别的概率最大。那么问题就转化为求解P(y1|x),P(y2|x...原创 2019-12-01 21:53:28 · 267 阅读 · 0 评论 -
机器学习二:决策树
什么是决策树?下图是一个是否出去玩耍的决策树,其中长方形代表判断模块,椭圆代表终止模块,箭头表示分支表格表示为:信息熵信息熵是度量样本集和纯度最常用的一种指标,假定样本集合D中第k类样本所占比例为pk(k=1, 2, 3…, m)则信息熵定义为H(X)越小,D的纯的越高...原创 2019-11-16 18:13:42 · 222 阅读 · 0 评论 -
机器学习一:k-近邻算法
什么是机器学习?在我们刚出生时,可以说我们对周围的事物一无所知,当我们第一次吃完苹果和梨后,下次吃时并不能分辨出两种水果的种类,但当我们吃过很多次后,再见到苹果和梨我们就能轻易地判断出来。机器学习简单来说可以理解成计算机认知的过程,但是计算机认知过程和人类认知过程有本质性的区别,人类是通过一次次不断实践来认知事物的,而计算机则是通过把大量无序的数据转换成有用的信息后总结出规律然后得出结论。简单...原创 2019-11-15 21:23:38 · 479 阅读 · 0 评论