ml
九日火
这个作者很懒,什么都没留下…
展开
-
决策树--python
决策树定义决策树是一种多功能的机器学习算法,它可以实现分类和回归任务,甚至实现多输出任务。决策树简单来说就是带有判决规则(if-then)的一种树,可以依据树中的判决规则来预测未知样本的类别和值。 决策树是一种有监管学习的分类方法。决策树的生成算法有 ID3 、C4.5 和 CART(Classification And Regression Tree)等,CART的分类效果一般优于其他...原创 2019-01-12 14:39:44 · 422 阅读 · 0 评论 -
支持向量机
支持向量机概念 支持向量机,因其英文名为support vector machine,故一般简称SVM,通俗来讲,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,其学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。线性SVM分类不同于其他的分类器,SVM分类器的决策边界,不仅分离了两个类别,而且尽可能的原理了最近的训练实例。从而实现在不同的类别...原创 2019-01-21 16:43:23 · 222 阅读 · 0 评论 -
K 近邻算法实现手写数字识别系统
k近邻算法k近邻算法通过测量不同特征值之间的距离来分类,具有如下优缺点优点:精度高,对异常值不敏感,无数据输入假定缺点:计算复杂度高,空间复杂度高K 近邻算法的工作原理是:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取...转载 2019-01-15 22:02:36 · 529 阅读 · 0 评论 -
线性回归模型
线性回归模型通过属性的线性组合进行预测的函数,即 f(x)=w1.x1+w2.x2+w3.x3+...+wn.xn+bf(x)=w1.x1+w2.x2+w3.x3+...+wn.xn+b向量形式为:f(x)=wT∗x+bf(x)=wT∗x+b 其中 w=(w1,w2,w3,...,wn)w=(w1,w2,w3,...,wn)令x0=1,w0=bx0=1,w0=b,则 f(x)=wT∗...原创 2019-01-09 15:01:34 · 866 阅读 · 0 评论 -
机器学习---分类
常见的机器学习监督式的学习任务包括回归任务和分类任务。这个部分来说明一下分类算法。本质给定一个对象X,将其划分到预定义好的某一个类别Yi中的算法。比如经典的mnist数据,将手写数字分类成不同的数字。首先来说明二元分类器二元分类器简单来说,二元分类器就是将事情分成是与非。接上面的例子,比如判断一个数字5,在二元分类器中就是用来分成两个类别:5or非5。此时随机梯度是一个很好的选...原创 2019-01-08 16:20:41 · 765 阅读 · 0 评论 -
随机梯度下降
假设我们提供了这样的数据样本(样本值取自于y=3*x1+4*x2):x1 x2 y1 4 192 5 265 1 194 2 29x1和x2是样本值,y是预测目标,我们需要以一条直线来拟合上面的数据,待拟合的函数如下:我们的目的就是要求出θ1和θ2的值,让h(θ)尽量逼近目标值y。这是一个线性回归问题,若对线性回归有...转载 2019-01-08 15:19:29 · 300 阅读 · 1 评论 -
人工神经网络
什么是神经网络基本结构说明:通常一个神经网络由一个input layer,多个hidden layer和一个output layer构成。图中圆圈可以视为一个神经元(又可以称为感知器)设计神经网络的重要工作是设计hidden layer,及神经元之间的权重添加少量隐层获得浅层神经网络SNN;隐层很多时就是深层神经网络DNN罗辑回归到神经元线性函数sigmoid...原创 2019-01-13 14:31:05 · 459 阅读 · 0 评论 -
tensorflow -------起步
Tensorflow是一个用于数值计算的强大开源软件库,非常适合大型机器学习。背后的原理十分简单,就是在python中定义一个用来计算的图,然后tensorflow就会用这个图,并用优化过的c++来执行计算。简单运行一个计算图,并在会话中执行import tensorflow as tfx=tf.Variable(3, name="x")y=tf.Variable(4, name="...原创 2019-01-13 11:21:52 · 153 阅读 · 0 评论 -
集成学习于随机森林--python
集成学习如果你向几千个人问一个复杂的问题,然后汇总他们的回答。一般情况下,汇总出来的回答比专家的回答要好。同样,如果你聚合一组预测器(比如分类器、回归器)的预测,的大的结果也比最好的单个预测器要好。这样的一组预测器称为集成,对于这种技术被称为集成学习,一个集成学习的算法被称为集成方法。常见的集成方法有如下集中,bagging,boosting,stacking。投票分类器假设你已经...原创 2019-01-12 16:53:33 · 393 阅读 · 0 评论 -
贷款自动审批模型
这个案例的背景:金融领域,申请贷款的人很多,可能银行每天要面对很多贷款申请,其中可能有很多不具备贷款资格的申请,为了缓解审批人员的工作量,可以根据申请人的一些资料,做一个模型自动过滤那些不具备贷款资格申请表。import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport matplotlib.imag...原创 2019-01-26 15:12:27 · 1809 阅读 · 0 评论