![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
风雪夜归子
风雪夜归子(Allen),机器学习算法攻城狮,喜爱钻研Meachine Learning的黑科技,对Deep Learning和Artificial Intelligence充满兴趣,经常关注Kaggle数据挖掘竞赛平台,对数据、Machine Learning和Artificial Intelligence有兴趣的童鞋可以一起探讨哦,个人CSDN博客:http://blog.csdn.net/u013719780?viewmode=contents
展开
-
机器学习系列:(八)感知器
感知器前面,我们介绍了广义线性模型,用联接方程描述解释变量、超参数和响应变量的线性关系。这一章,我们将介绍另一种线性模型,称为感知器(perceptron)。感知器是一种研究单个训练样本的二元分类器,训练较大的数据集很有用。而且,感知器和它的不足激发了我们后面两种将介绍的模型。感知器是Frank Rosenblatt在1957原创 2016-06-24 20:39:02 · 15616 阅读 · 3 评论 -
机器学习系列:(三)特征提取与处理
特征提取与处理上一章案例中的解释变量都是数值,比如匹萨的直接。而很多机器学习问题需要研究的对象可能是分类变量、文字甚至图像。本章,我们介绍提取这些变量特征的方法。这些技术是数据处理的前提——序列化,更是机器学习的基础,影响到本书的所有章节。分类变量特征提取许多机器学习问题都有分类的、标记的变量,不是连续的。例如原创 2016-06-23 15:31:11 · 71726 阅读 · 3 评论 -
机器学习系列:(一)机器学习基础
本章我们简要介绍下机器学习(Machine Learning)的基本概念。主要介绍机器学习算法的应用,监督学习和无监督学习(supervised-unsupervised learning)的应用场景,训练和测试数据的用法,学习效果评估方式。最后,对scikit-learn进行一些简单的介绍。自计算机问世以来,计算机可以学习和模仿人类智慧的观点,可谓“引无数英雄竞折腰”原创 2016-06-01 20:37:45 · 15878 阅读 · 4 评论 -
机器学习系列:(九)从感知器到支持向量机
从感知器到支持向量机上一章我们介绍了感知器。作为一种二元分类器,感知器不能有效的解决线性不可分问题。其实在第二章,线性回归里面已经遇到过类似的问题,当时需要解决一个解释变量与响应变量存在非线性关系的问题。为了提高模型的准确率,我们引入了一种特殊的多元线性回归模型,多项式回归。通过对特征进行合理的组合,我们建立了高维特征空间的解释变量与响应变量的线性关系模型。原创 2016-06-24 21:15:53 · 10244 阅读 · 0 评论 -
机器学习系列:(二)线性回归
线性回归本章介绍用线性模型处理回归问题。从简单问题开始,先处理一个响应变量和一个解释变量的一元问题。然后,我们介绍多元线性回归问题(multiple linear regression),线性约束由多个解释变量构成。紧接着,我们介绍多项式回归分析(polynomial regression问题),一种具有非线性关系的多元线性回归问题。最后,我们介绍如果训练模型获取目标函原创 2016-06-23 14:17:14 · 24727 阅读 · 3 评论 -
机器学习系列:(四)从线性回归到逻辑回归
从线性回归到逻辑回归在第2章,线性回归里面,我们介绍了一元线性回归,多元线性回归和多项式回归。这些模型都是广义线性回归模型的具体形式,广义线性回归是一种灵活的框架,比普通线性回归要求更少的假设。这一章,我们讨论广义线性回归模型的具体形式的另一种形式,逻辑回归(logistic regression)。和前面讨论的模型不同,逻辑回归是用来做分类任务的。分类任务原创 2016-06-23 15:45:15 · 17446 阅读 · 1 评论 -
机器学习系列:(五)决策树——非线性回归与分类
决策树——非线性回归与分类前面几章,我们介绍的模型都是广义线性模型,基本方法都是通过联接方程构建解释变量与若干响应变量的关联关系。我们用多元线性回归解决回归问题,逻辑回归解决分类问题。本章我们要讨论一种简单的非线性模型,用来解决回归与分类问题,称为决策树(decision tree)。首先,我们将用决策树做一个广告屏蔽器,可以将网页中的广告内容屏蔽掉。之后,我们原创 2016-06-24 15:09:14 · 17457 阅读 · 1 评论 -
机器学习系列:(六)K-Means聚类
K-Means聚类前面几章我们介绍了监督学习,包括从带标签的数据中学习的回归和分类算法。本章,我们讨论无监督学习算法,聚类(clustering)。聚类是用于找出不带标签数据的相似性的算法。我们将介绍K-Means聚类思想,解决一个图像压缩问题,然后对算法的效果进行评估。最后,我们把聚类和分类算法组合起来,解决一个半监督学习问题。在第一章,机原创 2016-06-24 19:07:02 · 29151 阅读 · 3 评论 -
机器学习系列:(七)用PCA降维
用PCA降维本章我们将介绍一种降维方法,PCA(Principal Component Analysis,主成分分析)。降维致力于解决三类问题。第一,降维可以缓解维度灾难问题。第二,降维可以在压缩数据的同时让信息损失最小化。第三,理解几百个维度的数据结构很困难,两三个维度的数据通过可视化更容易理解。下面,我们用PCA将一个高维数据降成二维,方便可视化,之后,我们原创 2016-06-24 19:54:36 · 26103 阅读 · 5 评论 -
机器学习系列:(十)从感知器到人工神经网络
从感知器到人工神经网络在第8章,感知器里,我们介绍了感知器,一种线性模型用来做二元分类。感知器不是一个通用函数近似器;它的决策边界必须是一个超平面。上一章里面介绍的支持向量机,用核函数修正了感知器的不足,将特征向量有效的映射到更高维的空间使得样本成为线性可分的数据集。本章,我们将介绍人工神经网络(artificial neural networks,ANN),一原创 2016-06-24 21:23:55 · 19093 阅读 · 0 评论