机器学习
broccoli2
这个作者很懒,什么都没留下…
展开
-
支持向量机通俗导论(理解SVM的三层境界)
            支持向量机通俗导论(理解SVM的三层境界)作者:July 。致谢:pluskid、白石、JerryLead。说明:本文最初写于2012年6月,而后不断反反复复修改&优化,修改次数达上百次,最后修改于2016年11月转载 2019-01-11 11:47:44 · 170 阅读 · 0 评论 -
贝叶斯(Bayes)——算法概念梳理与实际应用
基本概念导引:贝叶斯法是关于随机事件A和B的条件概率和边缘概率的。其中P(A|B)是在B发生的情况下A发生的可能性。 为完备事件组,即 在贝叶斯法则中,每个名词都有约定俗成的名称:P(A)是A的先验概率或边缘概率。之所以称为"先验"是因为它不考虑任何B方面的因素。P(A|B)...转载 2018-12-29 18:26:24 · 3727 阅读 · 0 评论 -
机器学习特征工程之数据降维
为什么进行特征选择?冗余:部分特征的相关度较高,容易消耗计算性能。噪声:部分特征对预测结果有影响。特征选择是什么特征选择APIsklearn.feature_selection.VarianceThold主成分分析PCAPCA是什么? 本质:PCA是一种分析、简化数据集的技术。 目的:是数据维数压缩,尽可能降低原数据的维数(复杂度),损失少量信息。 作用...原创 2018-07-09 17:03:59 · 411 阅读 · 0 评论 -
机器学习特征工程之特征预处理
特征预处理是什么?通过特定的统计方法(数学方法)讲数据转换成算法要求的数据。数值型数据:归一化标准化缺失值类别型数据:one-hot编码 时间类型:时间的切分特征选择的意义在对数据进行异常值、缺失值、数据转换等处理后,我们需要从当前数据集中选出有意义的特征,然后输入到算法模型中进行训练。对数据集进行特征选择主要基于以下几方面的考虑:1.冗余的特征会影响阻碍...原创 2018-07-09 16:02:12 · 936 阅读 · 0 评论 -
机器学习特征工程之特征抽取
1.数据集数据集是特征抽取的源数据。常用数据集的结构组成:特征值+目标值。 可用数据集: kaggle网址:http://www.kaggle.com/datasets UCI数据集:http://archive.ics.uci.edu/ml scikit-learn网址:http://scikit-learn.org/stable/datasets/index.html#da...原创 2018-07-09 16:01:26 · 1370 阅读 · 0 评论 -
机器学习算法入门介绍
本文共涉及三个问题:1.机器学习开发流程2.机器学习算法分类3.机器学习模型是什么我们做什么?分析大量数据分析具体业务应用常见算法特征工程、调参数、优化我们应该怎么做?学会分析问题,使用机器学习算法的目的,想要算法完成何种任务。掌握算法基本思想,学会对问题用相应的算法解决。学会利用哭或者框架解决问题。机器学习算法的判别依据...原创 2018-07-09 10:59:12 · 2135 阅读 · 0 评论 -
机器学习(一)
1.机器学习概念一个程序被认为能从经验E中学习,解决任务 T,达到性能度量值P,当且仅当,有了经验E后,经过P评判, 序在处理 T 时的性能有所提升。其实回归问题和分类问题的本质一样,都是针对一个输入做出一个输出预测,其区别在于输出变量的类型。 分类问题是指,给定一个新的模式,根据训练集推断它所对应的类别(如:+1,-1),是一种定性输出,也叫离散变量预测; 回归问题是指,给定一个新的模式,根据原创 2017-12-05 11:12:19 · 263 阅读 · 0 评论 -
监督学习--分类与回归的区别
其实回归问题和分类问题的本质一样,都是针对一个输入做出一个输出预测,其区别在于输出变量的类型。分类问题是指,给定一个新的模式,根据训练集推断它所对应的类别(如:+1,-1),是一种定性输出,也叫离散变量预测; 回归问题是指,给定一个新的模式,根据训练集推断它所对应的输出值(实数)是多少,是一种定量输出,也叫连续变量预测。举个例子: 预测明天的气温是多少度,这是一个回归任务; 预测明天是阴、晴还原创 2017-11-02 16:42:55 · 3848 阅读 · 1 评论