自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

转载 Machine Learning笔记整理 ------ (五)决策树、随机森林

1. 决策树 一般的,一棵决策树包含一个根结点、若干内部结点和若干叶子结点,叶子节点对应决策结果,其他每个结点对应一个属性测试,每个结点包含的样本集合根据属性测试结果被划分到子结点中,而根结点包含样本全集,从根结点到每个叶子结点的路径对应了一个判定测试序列。其基本流程如下所示: 输入:训练集D={(x1,y1), (x2, y2), ......, (xm, ym)} ...

2018-11-28 17:15:00 303

转载 Machine Learning笔记整理 ------ (四)线性模型

1. 线性模型 基本形式:给定由d个属性描述的样本 x = (x1; x2; ......;xd),其中,xi是x在第i个属性上的取值,则有: f(x) = w1x1 + w2x2+ ...... + wdxd + b 令w=(w1; w2; ......; wd),x =(x1;x2; ......;xd),使用矩阵乘法写为向量形式: f(x) = wTx + b ...

2018-11-27 15:17:00 111

转载 Machine Learning笔记整理 ------ (三)基本性能度量

1. 均方误差,错误率,精度 给定样例集 (Example set): D = {(x1, y1), (x2, y2), (x3, y3), ......, (xm, ym)} 其中xi是对应属性的值,yi是xi的真实标记,评估模型性能,即将预测结果f(x)与真实标记y进行比较。 对于回归任务:均方误差 (Mean squared error) 更一般的,对于数据分布D和概...

2018-11-26 22:14:00 165

转载 Machine Learning笔记整理 ------ (二)训练集与测试集的划分

在实际应用中,一般会选择将数据集划分为训练集(training set)、验证集(validation set)和测试集(testing set)。其中,训练集用于训练模型,验证集用于调参、算法选择等,而测试集则在最后用于模型的整体性能评估。 1. 留出法 (Hold-out) 将数据集D划分为2个互斥子集,其中一个作为训练集S,另一个作为测试集T,即有: D = S ∪ T, S...

2018-11-23 17:33:00 339

转载 Machine Learning笔记整理 ------ (一)基本概念

机器学习的定义:假设用P来评估计算机程序在某任务类T上的性能,若一个程序通过利用经验E,使其在T中任务获得了性能改善,我们则说关于任务类T和P,该程序对经验E进行了学习(Mitchell, 1997)。 机器学习的研究内容:关于在计算机上从数据中产生模型的算法,即学习算法(learning algorithm)。 1.名词定义 数据集 (Data set):数据的集合,其中每...

2018-11-23 15:43:00 116

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除