机器学习
文章平均质量分 64
天空下的斌
眼界与成就
展开
-
感知机模型
感知机模型模型介绍感知机(perceptron)是处理二分类的线性分类模型。感知机旨在求出将训练数据进行线性划分的分离超平面,属于判别模型,所以,导入误分类的损失函数,利用梯度下降法极小化损失函数找到分离超平面。模型概览方法:感知机模型 适用问题:二分类 模型特点:分离超平面 模型类型:判别模型 学习策略:极小化误分点到超平面距离 损失函数:误分点到超平面距离 学习算法:随机梯度下降法原创 2016-11-14 15:05:03 · 3429 阅读 · 2 评论 -
独热编码(One-Hot Encoding)介绍及实现
在数据处理和特征工程中,经常会遇到类型数据,如性别分为[男,女](暂不考虑其他。。。。),手机运营商分为[移动,联通,电信]等,我们通常将其转为数值带入模型,如[0,1], [-1,0,1]等,但模型往往默认为连续型数值进行处理,这样其实是违背我们最初设计的,也会影响模型效果。 独热编码便是解决这个问题,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候,其中只有一位有效。如自然编码为:0,1独热编码为:10,01 可以理解为对有m原创 2017-03-21 15:40:59 · 32418 阅读 · 0 评论 -
k近邻算法(KNN)
方法:k近邻法 适用问题:多类分类,回归 模型特点:特征空间,样本点 模型类型:判别模型k近邻法是一种基本分类与回归方法。思想是给定一个训练数据集,其中样本类别给定,分类时,对新的样本,根据其kk个最近邻的训练实例的类别,通过多数表决等方式进行预测。原创 2017-04-07 16:51:00 · 1192 阅读 · 0 评论 -
softmax 回归
Softmax回归是解决多分类问题,yy有多个类别,如在mnist数字识别中,kk=10. 在实际问题中,给定输入xx,我们的假设函数针对每一个类别ii估算出概率值,P(y=i|x)P(y=i|x).原创 2017-03-22 15:32:50 · 1100 阅读 · 0 评论