自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

转载 集成学习:以Bagging、Adaboosting为例

集成学习是一大类模型融合策略和方法的统称,以下以bagging和boosting为例进行说明:1、boostingboosting方法训练分类器采用串行的方式,每个弱分类器之间是相互依赖的,尤其后一个弱分类器是依赖于前一个分类器的分类结果而构建的此方法的基本思想是在每一层训练时,对前一层基分类器分错的样本,基于更高的权重,测试时,根据各层分类器的结果加权得到最终结果,即b...

2019-03-24 22:05:00 210

转载 项目二:新生儿黄疸辨别系统

本项目基于逻辑回归模型完成二分类问题。本项目为SIT国家级项目,由三人团队申请,本项目申请之初,考虑医院接诊量大,决定设计一个判别系统来判定黄疸的概率,来决定是否立马进行全面检查(当然这违背了先到先检查的原理,但是重病先治疗,也算是人之常情吧)问题一:数据属性处理问题1、对于皮肤颜色是否变黄,这种二分类的属性,采用1bit的哑变量0、1来对此属性进行反映;2、对于...

2019-03-23 17:48:00 149

转载 项目一:基于自编码器的药靶关系预测

一. 研究背景  药物研发领域,利用已知药物和靶标蛋白的相互作用关系建模。针对特定疾病的蛋白质可以找到与之作用的高亲和力的药物。传统方法考虑分子结构之间的相互对接,这依赖于药物分子和蛋白质的化学作用。  本项目基于深度学习,挖掘药物分子和蛋白质之间的相互作用关系,通过特征提取和组和来完成。二. 数据集及其描述  本项目完成关于药物分子和靶蛋白之间的亲和力预测。属于一个(二...

2019-03-22 23:27:00 526

转载 如何解决机器学习中数据不均匀问题

  不平衡程度相同(即正负样本比例类似)的两个问题,解决的难易程度也可能不同,因为问题难易程度还取决于我们所拥有数据有多大。比如在预测微博互动数的问题中,虽然数据不平衡,但每个档位的数据量都很大——最少的类别也有几万个样本,这样的问题通常比较容易解决;而在癌症诊断的场景中,因为患癌症的人本来就很少,所以数据不但不平衡,样本数还非常少,这样的问题就非常棘手。综上,可以把问题根据难度从小到大...

2019-03-21 17:22:00 443

转载 最大熵模型(MEM)

1. 最大熵原理最大熵Max Entropy原理:学习概率模型时,在所有可能的概率模型(即概率分布)中,熵最大的模型是最好的模型。通常还有其他已知条件来确定概率模型的集合,因此最大熵原理为:在满足已知条件的情况下,选取熵最大的模型。在满足已知条件前提下,如果没有更多的信息,则那些不确定部分都是“等可能的”。而等可能性 通过熵最大化来刻画。最大熵原理...

2019-03-21 09:30:00 231

转载 逻辑回归模型

1、首先给出LR模型的预测模型,再以极大似然进行讲解,给出为什么LR模型可以说明概率问题:2、求解LR模型参数,Loss function最小化极大似然的负数,再利用梯度下降求解1、为什么映射到0-1就代表概率?解释:并不是因为映射到0-1而代表概率,而是因为其本身就是概率公式,因而取值是0-1这里可以用纯概率公式进行推导,后面也可以用最大熵模型进行解释。...

2019-03-21 09:11:00 101

转载 C++中使用const修饰指针

在本文中呢,主要讲解四个方面,即:常量数据的与否和常量指针的与否中const如何对指针进行修饰:1.指向非常量数据的常量指针  对于一个指向非常量数据的常量指针,我们应该清楚的知道,在这我们注重的是指针常量,因此,指针始终指向一个内存地址,即该指针存储的地址数据不变,同时也可以通过此指针进行对应存储地址的数据修改,同时需要注意的是,时刻谨记声明为const的指针在声明时必须...

2017-07-21 09:53:00 97

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除