机器学习
芷若初荨
每天进步一小点,跨越未来一大步!朝梦想不断前进!
展开
-
项目实战——工业离散器件符合率的预测
数据背景介绍数据来源于DataFuntain中的离散制造过程中典形工件的质量符合率预测, 以某典型工件生产过程为例,我们将提供给参赛者一系列工艺参数,以及在相应工艺参数下所生产工件的质量数据。数据下载地址:[数据下载地址(百度云)](链接:https://pan.baidu.com/s/1AqlRVHrDAUHHt50eZsXK8A提取码:7pie )(如若失效了,请可以自行官网下载或者联...原创 2020-03-08 22:57:04 · 1384 阅读 · 18 评论 -
笔面试准备(3)——特征工程相关小结
特征工程简介**特征工程(Feature Engineering)**是指将原始数据转变成模型的训练数据的过程,从而更好地提取数据特征,使得机器学习模型的学习能力更好。其本质上是对原始数据的再加工,其目的是产生进入模型的特征。**特征工程分为数据预处理(Data Preprocessing)、特征构造(Feature Construction)、特征抽取(Feature Extraction)...原创 2020-03-05 22:44:20 · 589 阅读 · 0 评论 -
如何科学地评估和评判深度学习模型?
最近在考虑要发Paper,在模型的性能比较中,除了采用Precision/Recall的比较之外,为了进一步验证论文中的选择是存在可证明性的,因此考虑了使用F-test对多种模型算法进行统计显著性检验。常见的模型评估与方法误分率(misclassification rate),即准确度。精确率(precision)和召回率(recall)计算F1ROC曲线,ROC_AUCk-fold...原创 2019-10-22 17:05:36 · 2013 阅读 · 1 评论 -
第十二章-自我总结
在学习和推导了统计学习方法-李航(第2版)中的内容,收获蛮多,对此,既然轻轻地来了,那就得潇洒地给这个阶段学习的内容画上一个圆满的句号。统计学习方法总结以下是整本书中出现的10种统计学习方法的特点和概括总结,对于学习的一些方法,我们需要很清楚的知道这些统计学习方法的模型、策略、算法,还有适合应用的场景,这才对于我们以后在解决实际问题的过程中,才会清楚选择哪种比较适合当前需要解决的实际场景。另外...原创 2019-09-25 15:44:48 · 309 阅读 · 0 评论 -
第十一章-CRF的奇妙之处
上篇中,我们了解到HMM的相关知识,并且知道HMM属于概率有向图模型,接下来,让我们一起学习总结概率无向图模型——条件随机场(Conditional Random Field, CRF)。思维导图概率无向图模型概率无向图模型又称为马尔可夫随机场,是一个可以由无向图表示的联合概率分布。模型定义设有联合概率分布P(Y),由无向图G=(V,E)表示,V表示结点集合,E表示边集合,在图G中,结...原创 2019-09-25 15:44:03 · 451 阅读 · 0 评论 -
第十章-HMM模型以及相关推导
隐马尔可夫模型(Hidden Markov Model, HMM)是可用于标注问题的统计学习模型,描述由隐藏的马尔科夫链随机生成的观测序列的过程,属于生成模型,是概率模型的一种。本章主要是总结HMM模型的概率计算算法、学习算法以及预测算法。HMM在语音识别、自然语言处理NLP等领域有着广泛的应用。概率图模型常常是为了描述随机变量之间的关系(是不是独立的),分为有向图和无向图,而HMM主要用有向...原创 2019-09-25 15:43:09 · 498 阅读 · 0 评论 -
第九章-EM算法
从第九章开始,学习总结的东西有所不同了,第2-8章是分类问题,都属于监督学习,第9章EM算法是非监督学习。本文主要是总结EM算法的应用以及处理问题的过程和原理推导。EM算法EM算法(期望极大算法 expectation maximization algorithm)是一种迭代算法。当我们面对概率模型的时候,既有观测变量,又含有隐变量或者潜在变量。如果概率模型的变量都是观测变量,那么给定数据,...原创 2019-09-25 15:42:22 · 371 阅读 · 0 评论 -
第八章-提升方法AdaBoost算法
在2019年9月16日11晚,Jay Chou开始发布了他的新歌说好不哭的时候,不到12个小时,售出量就已经达到了500万,还导致了QQ音乐系统瘫痪,这充分看出周董的高流量人气,当然,作为90后的我也是其中粉丝之一。这告诉我们的是,无论做什么,扎实的基础很重要的,如果周董没有扎实的音乐基础(PS:当然,也不否认他在音乐方面也具备一定的天赋),他也不会在经过这么长时间后重发表新歌时再次受到很多的粉...原创 2019-09-25 15:41:32 · 246 阅读 · 0 评论 -
第六章-逻辑回归与最大熵模型
逻辑斯谛回归是统计学习中的经典分类方法,和最大熵模型相比,具有以下的共同点和区别:共同点都属于概率模型,该模型要寻找的是给定一个x,得到输出变量Y的概率分布P(Y|x),如果是二分类,Y取值为0或1,如果是多分类,Y有K个不同的类别。都属于对数线性模型,对概率分布P(Y|x)取对数,可得lnP(Y|x)=w * x关于x的线性函数。两个模型之前的区别是Logistic回归属于判别模...原创 2019-09-25 15:39:19 · 708 阅读 · 0 评论 -
第五章-一起看决策树如何做出决策?
在前面我们学习了KNN是一种基本的分类和回归方法。今天我们继续来学习另一个也能进行分类和回归的方法——决策树(Decision Tree)。那么对此,决策树到底是如何做出决策的呢?请接下来往下看——思维导图(内容概览)衡量标准对于一个统计学习方法,我们需要从模型+决策+算法逐步入手。但是在认识模型之前,特征的选取又是显得特别重要,在决策树法中,存在一些比较重要的概念,即选取特征的标准。...原创 2019-09-25 15:38:17 · 759 阅读 · 0 评论 -
第四章-朴素贝叶斯朴素吗?
你觉得朴素贝叶斯朴素吗? 个人觉得,一点也不朴素,如同“平凡出真知”,朴素贝叶斯还是很挺厉害的。如果想要了解朴素贝叶斯,那么需要先了解贝叶斯估计和极大似然估计。极大似然估计对于一个数据集T服从概率分布P,但是P中参数未知,针对极大似然估计,就是将未知参数看作一个定值,从而找未知参数能使得数据集T发生的概率最大。极大似然估计:假设某个数据集T(x1,x2,...,xn)服从正态分布X&nbs...原创 2019-09-25 15:37:10 · 211 阅读 · 0 评论 -
第三章-KNN(分类和回归算法模型)
上上一章已经学习了感知机模型、策略和算法,感知机对于分类任务有着其优点,但是该模型是在具有强假设的条件下——训练数据集必须是线性可分的,但是如果数据集是呈现无规则的分布,那么此时如果要做分类任务,还可以考虑k近邻(KNN),这是一种基本的分类和回归方法,既可以做简单的二分类也可以做复杂的多分类任务,还可以做回归任务。KNN模型KNN模型实际上对应于对特征空间的划分,虽然没有具体的数学抽象语言描...原创 2019-09-25 15:35:48 · 1419 阅读 · 0 评论 -
第二章-感知机
看完上一章的概要学习后,开始就进入第二章的内容——感知机。对于统计学习方法而言,包含三要素,模型+策略+算法,接下来就从以下三个要素全面了解感知机。感知机模型简单来说,感知机(Perceptron)针对的是二分类的线性模型,其输入为实例的特征向量,输出为实例的类别,取+1、-1。利用数学语言抽象模型可以这样描述:假设输入空间(特征空间)是χ∈Rn,输出空间是y=+1,−1,输入x∈χ表示实例...原创 2019-09-25 15:34:22 · 360 阅读 · 0 评论 -
第一章-统计学习方法概论
统计学习统计学习是关于计算机 基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。总的来说,统计学习也称为统计机器学习。统计学习的特点以计算机以及网络为平台;以数据为对象,是数据驱动的学科;目的是对数据进行预测和分析;以方法为中心,构建模型并应用模型进行预测和分析;是概率论、统计学、信息论、计算理论、最优化理论以及计算机科学等多个领域的交叉学科,具...原创 2019-09-25 15:32:27 · 310 阅读 · 0 评论