机器学习
文章平均质量分 88
longgb123
这个作者很懒,什么都没留下…
展开
-
数据
原版:http://www.jianshu.com/p/8a763fd69e19一、数据知识如果若干属性是强相关的,则说明这些属性可能提供了高度冗余的信息,我们可以决定只保留一个。二、数据预处理1、维规约:通过创建新属性,将一些旧属性合并在一起来降低数据的维度。通过选择旧属性的子集得到的新属性,这种维规约称为特征子集选择。2、维灾难:数据维度(属性)过高。数据稀疏,对于分类,没有足够多的数据用于建模原创 2016-10-30 09:45:53 · 507 阅读 · 0 评论 -
【工程】Pulp-案例混合问题(四)
一、问题描述Ben这个人,想要尽可能便宜地生产他们的猫粮产品,同时确保他们满足罐装食品的营养分析要求。因此,他们想要改变每种食材的用量(主要成分是鸡肉、牛肉、羊肉、大米、小麦和凝胶),同时还能满足他们的营养标准。 鸡肉、牛肉和羊肉的成本分别为0.013美元、0.008美元和0.010美元,而大米、小麦和凝胶的成本分别为0.002美元、0.005美元和0.001美元(所有费用都是每克)。 食...翻译 2018-04-07 12:32:54 · 425 阅读 · 0 评论 -
【工程】Pulp-Amply(三)
一、Amply二、声明和数据语句三、快速入门指南三、API一、AmplyAmply允许您以Python数据结构加载和操作AMPL数据。 Amply只支持AMPL语法的特定子集: 1、设置声明 2、设置数据语句 3、参数声明 4、参数数据语句二、声明和数据语句通常,在AMPL中表达的问题包括两个部分,一个模型部分和一个数据部分。Amply只设...翻译 2018-04-07 12:30:37 · 332 阅读 · 0 评论 -
【算法】Pulp-优化的概念(二)
一、线性规划二、整数规划一、线性规划最简单的数学程序是一个线性程序。为了让你的数学程序成为一个线性程序,你需要以下条件: 1、决策变量必须是实数变量; 2、目标必须是一个线性表达式; 3、约束必须是线性表达式。线性表达式是以下形式的表达式: 其中aiaia_{i}和bbb是已知的常数,xixix_{i}是变量。解这样的规划问题称为线性规划。线性规划是通过经...翻译 2018-04-07 12:28:27 · 854 阅读 · 0 评论 -
【算法】Pulp-优化的过程(一)
一、简介二、模过程2.1 问题描述2.2 制定的数学程序2.3 解决数学程序2.4 执行一些post-optimal分析2.5 提供解决方案和分析一、简介解决一个优化问题不是一个线性过程,但是这个过程可以分解成五个一般步骤: 1、问题描述 2、制定的数学程序 3、解决数学程序 4、执行一些post-optimal分析 5、提供解决方案和分析然而...翻译 2018-04-07 12:26:21 · 979 阅读 · 1 评论 -
【算法+工程】单纯形法.md
一、优化问题标准型1.1 问题例子1.2 数学形式1.3 标准型1.4 转化为标准型二、单纯形法2.1 单纯形法思路2.2 单纯形法步骤2.3 单纯形法表格形式表格公式推导表格形式表示2.4 单纯形法简版代码一、优化问题标准型1.1 问题例子某工厂在计划期内要安排生产Ⅰ、Ⅱ两种产品 , 已知生产单位产品所需的设备台时及A、B两种原材...原创 2018-04-14 19:27:24 · 1186 阅读 · 1 评论 -
【算法】局部加权回归(Lowess)
一、简介1.1 预测问题1.2 平滑问题二、算法讲解2.1 算法思想2.2 参数讲解2.3 权值函数2.4 回归迭代2.5 间隔回归,中间插值2.6 其他参数三、实验效果3.1 效果3.2 效率3.3 效果对比一、简介1.1 预测问题对于预测问题,回归中最简单的线性回归,是以线性的方法拟合出数据的趋势。但是对于有周期性,波动性的...原创 2018-03-11 22:04:28 · 70800 阅读 · 21 评论 -
线性回归,加权回归,推导过程
一普通线性回归OLS二加权回归一、普通线性回归(OLS)损失函数: J(w)=1n∑i=1n(yi−w∗xi)2=1n||Y−X∗w||2J(w)=\frac{1}{n}\sum_{i=1}^{n}(y_{i}-w*x_{i})^{2}=\frac{1}{n}||Y-X*w||^{2} 其中:YY、ww、xix_{i}为向量,XX为矩阵。对该损失函数求解如下,即为对J(原创 2018-01-16 21:29:18 · 10668 阅读 · 9 评论 -
聚类分析(1):基本概念和算法
原版:http://www.jianshu.com/p/ff0e0d52fbed一、概述(1)聚类分析 目标是,分组数据使得,组内的对象是相似的(相关的),不同组是不同的(不相关的)。(2)聚类类型1、层次、划分层次聚类(嵌套聚类,hierarchial clustering):聚类簇组织成一棵树,每一个结点是其子女的并。 划分聚类(非嵌套聚类,partional clustering):简原创 2016-11-02 09:41:55 · 9428 阅读 · 0 评论 -
分类(6):不平衡和多分类问题
原版:http://www.jianshu.com/p/15185f0ecb57一、不平衡问题(1)不平衡数据例如:一个产品生产的不合格产品数量会远低于合格产品数量。信用卡欺诈的检测中,合法交易远远多于欺诈交易。 这时候,准确率的度量会出现一些问题,因为她把每个类都看得同等重要。 例如,1%的信用卡交易是欺诈行为,则预测每个交易都是合法的模型有99%的准确率,它也可能检测不到任何欺诈交易。(2)原创 2016-11-02 09:35:27 · 1890 阅读 · 0 评论 -
分类(5):组合分类器-随机森林
原版:http://www.jianshu.com/p/379018d420c1一、组合方法(1)组合分类器原理:考虑25个二元分类器,每一个分类误差a=0.35。组合分类器通过多数投票,如果基分类器是独立的,则仅当超过一半的基分类器都预测错误时,组合才会错误,则: eensemble=∑i=125Ci25ai(1−a)25−i=0.06e_{ensemble}=\sum_{i=1}^{25}C_原创 2016-11-02 09:31:37 · 4583 阅读 · 0 评论 -
分类(3):人工神经网络(ANN)
原版:http://www.jianshu.com/p/109c84ada9b2一、感知器下图为一个感知器,单个神经元。 该感知器的算法: 二、多层人工神经网络(1)基本概念神经网络,这里先以前馈神经网络为介绍,每层为全连接,则对于2个神经元,参数为: (1)w权值,(2)b偏置,(3)delta 激活函数。多层神经网络的结构图,以下为前馈神经网络的结构(2层): 常用的 delta 激原创 2016-11-02 09:26:59 · 588 阅读 · 0 评论 -
分类(2):k-最近邻、贝叶斯分类器
一、k-最近邻1、算法积极学习方法(eager learner):通过训练样本建立模型。 消极学习方法(lazy learner):实例的学习,k-最近邻就属于这种。k-最近邻算法:令k是最近邻数目,D是训练样例集合for z in 样例集合: 计算 z 和每个样例 (x,y) 的距离 d 选择离 z 前 k 个近距离的点,为集合 Dt z的标记 y 为 Dt 中类较多的k-最近邻采原创 2016-11-02 09:24:27 · 3686 阅读 · 0 评论 -
分类(1):决策树与模型评估
一、如何建立决策树1、Hunt算法Hunt算法是许多决策树算法的基础,包括ID3、C4.5、CART。 Hunt算法步骤: (1)如果Dt中所有数据都属于同一个类yt,则t是叶结点,用yt标记。 (2)如果Dt中包含属于多个类的数据,则选择一个属性,将数据划分为较小子集。创建子女结点,将数据按属性放入子女结点中,然后递归调用该算法。但是该算法对于大多数情况太苛刻了,需要附加: (1原创 2016-10-30 16:16:34 · 12905 阅读 · 0 评论 -
分位数回归-Quantile regression
文章目录一、分位数回归概念二、相关推导2.1 分位数概念2.2 离差绝对值LAD2.3 分位数回归2.4 效果以及理解三、模型检验四、求解方法一、分位数回归概念分位数回归是估计一组回归变量X与被解释变量Y的分位数之间线性关系的建模方法。以往的回归模型实际上是研究被解释变量的条件期望。而人们也关心解释变量与被解释变量分布的中位数,分位数呈何种关系。它最早由Koenker和Bassett(197...原创 2018-12-16 12:09:21 · 56430 阅读 · 1 评论