- 博客(5)
- 资源 (2)
- 收藏
- 关注
原创 规则化和模型选择
一、交叉验证训练集S,模型集合M1、简单交叉验证:70%S训练M,训练出参数,求得假设函数h,在30%S上得到相应的经验错误,选择最小的最为最好的模型2、k折交叉验证:将交叉验证的测试集/k,每个模型训练k次,测试k次,得到的错误率/k。一般k取10。3、留一交叉验证:每次只留一个样例作为测试。(用于数据稀疏的情况)二、特征选择严格来讲也是模型选择的一种1、为什么要做特征选择在有限的样本数目下,用...
2018-03-25 21:58:22 12202
原创 判别模型、生成模型与贝叶斯方法
一、判别模型与生成模型 判别模型:用特征值来求结果的概率,形式化表示为,在参数确定的情况下,求解条件概率。通俗的解释为在给定的特征后预测结果出现的概率。 生成模型: 或p(y) - 生成模型:无穷样本==》概率密度模型 = 产生模型==》提取特征,预测(求条件概率) - 判别模型:有限样本==》判别函数 = 预测模型==》提取特征,求概率大小(求联合概率)常见的判别模型:线性回...
2018-03-25 17:53:41 2247
原创 对回归方法的认识
回归问题:属于有监督问题,可以处理多维数据 连续型模型,受噪声影响较大核心思想:从离散的统计数据中得到数学模型,然后将该数学模型用于预测或者分类。CF:分类问题:如果要预测的目标是离散的 回归问题:如果要预测的目标是连续的几个概念输入数据:x,一般是训练集或者是训练数据输出数据:y拟合函数:y=h(x)一、线性回归 线性回归假设特征(x)和结果(...
2018-03-25 16:18:26 432
原创 贝叶斯估计(概率密度函数的估计的参数方法)
接上一篇文章:最大似估计贝叶斯估计: 参数估计 是最随机变量,根据观测数据对参数的分布进行估计,还要考虑先验分布最大似然估计: 参数估计 是未知的,根据观测数据来估计 的值。贝叶斯学习是把贝叶斯估计的原理应用于直接从数据对概率密度进行估计开始我们今天的表演一、贝叶斯估计可以将概率密度函数参数估计问题看成是贝叶斯决策问题 ...
2018-03-23 10:48:49 12821 1
原创 最大似然估计(概率密度函数的估计的参数方法)
最大似然估计 有以下几个假设: 确定但未知 样本 独立同分布 类条件概率密度 有确定的函数形式 ...
2018-03-23 10:10:38 10272
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人