自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 K最近邻算法(K-NN)

K-NN是什么? K最近邻算法是一种简单但目前最常用的分类算法,也可用于回归。 KNN没有参数(不对数据潜在分布规律做任何假设),基于实例(不建立明确的模型,而是通过具体的训练实例进行预测),用于监督学习中。 K-NN算法怎么工作? 当用KNN进行分类时,得到的结果是某一类(预测类别——一个离散值)。 这个方法有三个要素:一组有标签的对象,对象间的距离,K值(最近邻的个数)。 ##进行预测 为了给...

2018-10-31 15:57:52 3573

原创 决策树

一、基本流程 决策树是一类常见的机器学习方法,是一个类似于流程图的树形结构。 一颗决策树包含一个根结点、若干个内部结点和若干个叶结点。树的最高层是就是根结点;树内部的每一个结点代表的是对一个特征的测试,树的分支代表该特征的每一个测试结果;叶结点代表对应的决策结果。 下图即为一个决策树的示意描述,内部节点用椭圆表示,叶子节点用矩形表示。该决策树用于对一个用户是否可以偿还债务进行分类预测。 比如新来...

2018-10-31 15:24:56 716

原创 逻辑回归(Logistic Regression)

一、什么是逻辑回归 逻辑回归用于分类问题。在分类问题中,我们尝试预测目前观测目标属于哪一类,它会产生一个离散的二元结果y∈{0,1}。而线性回归模型产生的预测值为z=θTx是实数值,于是我们引入一个新的模型,使输出变量z的值到始终在0和1之间,于是便找到了Sigmoid function。 Sigmoid function的图像是一条值在0-1之间的S形曲线,如图: 通常,我们把Sigmoid...

2018-10-25 09:49:26 275

原创 模型评估与选择

一、基本概念 1. 经验误差与泛化误差 2. 过拟合与欠拟合 二、评估方法 1. 留出法 2. 交叉验证法 3. 自助法 三、性能度量 1. 回归 1.1 均方误差 1.2 均方根误差 2. 分类 2.1 错误率与精度 2.2 查准率、查全率与F1 2.3 ROC与AUC 2.4 代价敏感错误率与代价曲线 四、比较检验 1. 假设检验 2. 交叉验证t检验 3. 卡方分布 4. Friedman检...

2018-10-19 09:09:04 2026

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除