- 博客(4)
- 资源 (2)
- 问答 (2)
- 收藏
- 关注
原创 集成学习---个体学习器的多样性
无论是串行生成的个体学习器,还是同时生成的个体学习器,我们都希望我们所集成的个体学习器是“好而不同的”,“好而不同”的学习器就涉及到个体学习器的两个方面,个体学习器的“准确性”和“多样性”。而“准确性”和“多样性”之间是冲突的,也就是说准确性很高之后,要增加多样性就需要牺牲准确性。
2017-02-04 17:00:55 1372
原创 集成学习---如何增强个体学习器的多样性
简单地利用初始数据训练出的个体学习器多样性一般比较差,我们可以在学习过程中利用对数据样本、输入属性、输出表示、算法参数进入扰动引入随机性来增强个体学习器的多样性。数据样本扰动数据样本扰动对“不稳定基学习器”很有效,这样的“不稳定基学习器”主要有决策树、神经网络。训练样本稍微有些变化就会导致学习器有显著的变动。而有些基学习器对数据样本的扰动是不敏感的,比如线性学习器、支持向量机、朴素贝叶斯、K近邻学习
2017-02-03 11:35:07 4949
原创 集成学习---随机森林
Bagging随机森林(Random Forest,简称RF)是Bagging的一个扩展变体。Bagging在1996年由Beriman提出,作为并行式集成学习方法中最著名的代表,利用自助采样法。可采样出T个含m个训练样本的采样集,然后基于每个采样集训练出一个基学习器,再将这些基学习器进行结合。这就是Bagging的基本路程。对分类任务使用简单投票法,对回归任务简单平均。 随机森林(RF)RF在以
2017-02-02 11:53:22 2754
原创 模型评估与选择
在机器学习中,我们应该如何去评估我们的学习模型的学习效果,这自然就涉及到了模型评估与选择的问题。我们希望,学习模型能够从训练样本中尽可能学出使用于所有潜在样本的“普遍规律”,这样才能在遇到新样本时做出正确的判别。然后,当学习器把训练样本学的“太好”的时候,很可能已经把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质,这样就会导致学习模型的泛化性能下降,这种现象在机器学习中称为“过拟合”。相
2017-02-01 13:58:52 670
DropDownList 的获取值的问题
2015-05-01
Response.Redirect ("indexp.aspx")在跳转时没有反应
2015-04-29
TA创建的收藏夹 TA关注的收藏夹
TA关注的人