![](https://img-blog.csdnimg.cn/20190307205902698.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
机器学习
博主将在此专栏对机器学习的一些内容进行不定时整理更新
Halosec_Wei
该博主主攻python数据分析,数据挖掘,机器学习方向
展开
-
关于机器学习评价指标AUC,召回率,准确率(ACC),MRR的白话讲解
准确率(ACC)指在分类中,使用测试集对模型进行分类,分类正确的记录个数占总记录个数的比例,计算公式如下所示:其中,代表分类正确的记录个数,代表全部测试数据的个数 ROC曲线下方的面积大小(AUC)AUC(Area Under Curve)[3]被定义为ROC曲线下的面积,使用AUC值作为评价标准是因为很多时候ROC曲线并不能清晰的说明哪个分类器的效果更好,而作为一个数值,...原创 2018-10-19 17:27:50 · 11863 阅读 · 5 评论 -
机器学习 最邻近规则分类(knn)算法(理论+python代码实现)
1.综述1.1 over和Hat在1968年提出了最初的邻近算法1.2分类( classification)算法1.3输入基于实例的学习( nstar∩ce- based learning),懒惰学习( lazy learning)2 例子这里举个例子,假如我们有两个特征工程打斗次数与接吻次数,通过分析可以看到,我们接吻次数多的,我们归类为浪漫类型,打斗次数多的,我们归为动作片...原创 2018-07-16 23:09:14 · 788 阅读 · 0 评论 -
机器学习 深度学习基础介绍
什么是深度学习?深度学习是基于机器学习延伸出来的一个新的领域,由以人大脑结构为启发的神经网络算法为起源加之模型结构深度的増加发展,并伴随大数据和计算能力的提高而产生的一系列新的算法。这是一个深度学习的网络模型图深度学习是什么时候发展起来的呢?其概念由著名科学家 Geoffrey Hinton等人在2006年和2007年在《 Sciences》等上发表的文章被提出和兴起...原创 2018-07-16 17:49:27 · 532 阅读 · 0 评论 -
机器学习 机器学习概念
概念:机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。学科定位人工智能( Artificial Intelligence,AI)的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各...原创 2018-07-16 17:32:33 · 530 阅读 · 0 评论 -
Python机器学习 贝叶斯模型
贝叶斯简介:贝叶斯(约1701-1761) Thomas Bayes,英国数学家贝叶斯方法源于他生前为解决一个“逆概”问题写的一篇文章生不逢时,死后它的作品才被世人认可贝叶斯要解决的问题:正向概率:假设袋子里面有N个白球,M个黑球,你伸手进去摸一把, 摸出黑球的概率是多大逆向概率:如果我们事先并不知道袋子里面黑白球的比例,而是闭着眼睛 摸出一个(或好几个)球,观察这些取出来的球的...原创 2019-03-07 18:08:12 · 688 阅读 · 0 评论 -
机器学习 机器学习中的基础概念
基本概念训练集,测试集,特征值,监督学习,非监督学习,半监督学习,分类,回归概念学习人类学习概念:鸟,车,计算机定义:概念学习是指从有关某个布尔函数的输入输出训训练阳历中推断出该布尔数例子:学习“享受运动”这一概念:小明进行水上运动,是否享受运动取決于很多因素这里举一个例子小明是否进行水上运动,取决于天气,温度,湿度风力,水温,预报等特征工程,通过对小明是否享受运动...原创 2018-07-16 18:31:54 · 472 阅读 · 0 评论 -
Python机器学习 聚类算法K-MEANS DBSCAN
聚类概念:无监督问题:我们手里没有标签了难点:如何评估,如何调参聚类:相似的东西分到一组K-MEANS算法基本概念:要得到簇的个数,需要指定K值距离的度量:常用欧几里得距离和余弦相似度(先标准化)优化目标:工作流程: (1)从数据中随机选择k个对象(如三分类,K=3)作为初始聚类中心; (2)计算每个聚类对象(样本)到聚类中心(随机选择的点)的...原创 2019-03-07 14:02:23 · 605 阅读 · 0 评论 -
Python机器学习 决策树
树模型决策树:从根节点开始一步步走到叶子节点(决策)所有的数据最终都会落到叶子节点,既可以做分类也可以做回归树的组成根节点:第一个选择点非叶子节点与分支:中间过程叶子节点:最终的决策结果决策树的训练与测试训练阶段:从给定的训练集构造出来一棵树(从跟节点开始选择特征, 如何进行特征切分)测试阶段:根据构造出来的树模型从上到下去走一遍就好了一旦构造好了决策树,那么分类或...原创 2019-02-17 16:06:08 · 411 阅读 · 0 评论 -
Python机器学习 smote过采样算法
SMOTE全称是Synthetic Minority Oversampling Technique即合成少数类过采样技术,它是基于随机过采样算法的一种改进方案,由于随机过采样采取简单复制样本的策略来增加少数类样本,这样容易产生模型过拟合的问题,即使得模型学习到的信息过于特别(Specific)而不够泛化(General),SMOTE算法的基本思想是对少数类样本进行分析并根据少数类样本人工合成新样本...原创 2019-02-12 18:19:52 · 6713 阅读 · 0 评论 -
Python机器学习 逻辑回归
逻辑回归算法是一个基于线性回归的非线性化的二分类算法这里介绍一个非线性函数Sigmoid函数(有些神经网络也用它来进行参数非线性化)其中的Z为线性回归求导后的目标函数,因为最小二乘法可能求不出结果,但是梯度下降法是一定求得出结果的,区别在于速度我们可以看到Sigmoid函数图像为可以看到自变量取值为任意实数,值域[0,1]所以这里的解释是:我们将任意的输入映射到...原创 2019-02-01 00:37:29 · 225 阅读 · 0 评论 -
Python机器学习 梯度下降法
大家可以参看这篇文章,我认为是全网讲得最好的https://www.jianshu.com/p/c7e642877b0e这里进行一下补充:梯度其实就是梯度其实就是函数的微分,代表着函数在某个给定点的切线的斜率,而在多变量函数中,梯度是一个向量,向量有方向,梯度的方向就指出了函数在给定点的上升最快的方向梯度上升就是梯度,梯度下降则是梯度的反方向寻找山谷的最低点,也就是我...原创 2019-02-01 00:14:26 · 280 阅读 · 0 评论 -
Python机器学习 线性回归(拟合)数学原理与最小二乘法
首先 说明一下什么是线性规划线性规划(Linear programming,简称LP)是运筹学中研究较早、发展较快、应用广泛、方法较成熟的一个重要分支,它是辅助人们进行科学管理的一种数学方法举个例子有这么一些数据:其目标:预测银行会贷款给用户多少钱?考虑:工资和年龄都会影响最终银行贷款的结果那么它们各自有多大的影响呢?我们可以画个图X1,X2就是我们的两个特征(...原创 2019-01-23 23:25:19 · 2593 阅读 · 0 评论