bioinformatics
文章平均质量分 72
生物信息知识茫茫多
Ritannn
这个作者很懒,什么都没留下…
展开
-
L-BFGS-B
算法概述在每次迭代开始时,给出当前迭代,函数值,梯度和一个正定的有限内存近似。这使得我们可以形成在处的二次模型,(2.1)该算法在边界下近似最小化。首先使用梯度投影方法(gradient projection)来找到一组活动边界,然后将这些边界作为等式约束最小化。为了实现这个目标,我们首先考虑分段线性路径(piecewise linear path)上式通过将最陡的下降方向投影到可行区域得到,其中(2.2)然后计算广义柯西点(generalized Cauchy poi.原创 2021-10-19 13:11:13 · 4618 阅读 · 1 评论 -
Cholesky分解(matlab )
通过Cholesky分解,可以将线性方程组Ax = b替换成R'Rx = b由于反斜杠运算符能识别三角形方程组,因此这可以在MATLAB环境中通过以下表达式快速进行求解x = R\(R'\b)如果A为n×n,则chol(A)的计算复杂度为O(n^3),但后续的反斜杠解的复杂度仅为O(n^2)。...转载 2021-10-14 14:57:12 · 2234 阅读 · 0 评论 -
读《Learning with Local and Global Consistency》
摘要我们考虑从标记和未标记数据中学习的一般问题,这通常被称位半监督学习或转导推理。半监督学习的一种原则方法是设计一个分类函数,该函数对于已知的标记点和未标记点所揭示的内在结构具有足够的平滑性。我们提出了一个简单的算法来获得这样一个平滑的解。我们的方法在一些分类问题上产生了令人鼓舞的实验结果,并证明了对未标记数据的有效使用。1 介绍我们考虑常规的从标记和未标记数据中学习的问题。给定一个点集...原创 2021-10-12 21:34:41 · 942 阅读 · 0 评论 -
读《A survey on semi-supervised learning》(三)
5 无监督预处理现在我们转向第二类归纳方法,称为无监督预处理,它不同于包装方法和本质上的半监督方法,将未标记数据和标记数据分为两个独立的阶段使用。通常,无监督阶段包括从未标记数据中自动提取或转换样本特征(特征提取),对数据进行无监督聚类(聚类即标记),或初始化学习过程的参数(预训练)。5.1 特征提取自早期机器学习以来,特征提取在分类器的构建中起着重要的作用。特征提取方法试图找到输入数据转换,以提高分类器的性能或使其构造在计算上变得更加高效。特征提取是一个广泛的研究主题,已经被几本书和调查涵盖。原创 2021-10-09 15:40:57 · 480 阅读 · 0 评论 -
读《A survey on semi-supervised learning》(二)
4 包装方法包装方法是半监督学习中最古老和最广为人知的算法之一(Zhu,2008)。他们利用一个或多个有监督的基础学习器,用原始标记数据和先前未标记的数据迭代训练这些数据,这些数据是用来自学习器早期迭代的预测增强的。后者通常被称为伪标签数据。该程序通常包括训练和伪标记两个交替的步骤。在训练步骤中,一个或多个有监督的分类器在标记的数据上训练,也可能是以前迭代的伪标记数据。在伪标签步骤中,生成的分类器用于为先前未标记的对象推断标签;学习器对其预测最有信心的数据点进行伪标记,以便在下一次迭代中使用。包装方原创 2021-10-08 21:45:43 · 663 阅读 · 0 评论 -
读《A survey on semi-supervised learning》(一)
摘要半监督学习是机器学习的一个分支,涉及使用有标记和无标记的数据来执行某些学习任务。它在概念上介于监督学习和非监督学习之间,允许在许多用例中利用大量未标记的数据,并通常结合较小的标记数据集。近年来,该领域的研究遵循了机器学习的一般趋势,重点关注基于神经网络的模型和生成学习。关于这一主题的文献在数量和范围上也有所扩大,现在包括了广泛的理论、算法和应用。然而,最近没有收集和组织这些知识的调查,阻碍了研究人员和工程师利用这些知识的能力。为了填补这一空白,我们提出了半监督学习方法的最新概述,包括早期工作以及最新原创 2021-10-07 21:15:11 · 889 阅读 · 0 评论 -
拉普拉斯矩阵和拉普拉斯二次型
1 当深度学习遇上图:图神经网络的兴起1.1 什么是图在计算机领域,通常用图指代一种广义的抽象结构,用来表示一堆实体和它们之间的关系。用于生物研究的蛋白质网络,能够表示蛋白质之间的相互作用。1.2 深度学习与图大部分传统深度学习模型,如卷积神经网络,循环神经网络等,处理的数据都限定在欧几里得空间,如二维的网格数据——图像和一维的序列数据——文本,因为它们的模型设计正得益于欧几里得空间中这些数据的一些性质:例如,平移不变性和局部可连通性。图数据不像图像和文本一样具有规则的欧几里得空间结原创 2021-10-07 11:13:30 · 2592 阅读 · 0 评论 -
读《Prioritizing disease genes with animproved dual label propagation framework》
摘要背景:疾病基因优先排序是试图找出某一特定表型的潜在致病基因,从而揭示人类疾病的遗传基础,促进药物的开发。本文的动机是受到标签传播算法和假阳性蛋白质-蛋白质相互作用的启发。假阳性蛋白质-蛋白质相互作用此前没有在疾病基因优先排序中被考虑过。在以往的基于网络的方法中,标记传播已经成功地应用于对致病基因进行优先排序。这些基于网络地方法使用基本的标签传播,比如随机游走,在网络上以不同的方式优先考虑疾病基因。然而,这些方法不能处理数据集中存在大量假阳性蛋白相互作用的情况,因为在以往的方法中,PPI网原创 2021-10-04 15:23:28 · 535 阅读 · 0 评论 -
tlDLP算法
读《Transfer learning across ontologies forphenome–genome association prediction》其中LBFGSB是限制内存的箱形约束优化的BFGS函数,属于最优化的内容。第十一行可以写成如下:第十六行可以写成如下:其中和只对已知关联做计算,其它的计为0。输入该算法的输入为::第一个是已知的用于训练的基因-功能关联; 第二个是已知的用于训练的基因-表型关联; 第三个是标准化后的PPI权重网络的矩阵;..原创 2021-10-03 14:45:30 · 197 阅读 · 0 评论 -
DLP算法
读《Transfer learning across ontologies forphenome–genome association prediction》其中LBFGSB是限制内存的箱形约束优化的BFGS函数,属于最优化的内容。第七行可以写出如下:其中只对已知关联做计算,其它的计为0。输入该算法的输入为,,:第一个是已知的用于训练的基因-表型关联; 第二个是标准化后的PPI权重网络的矩阵; 第三个是标准化后表型本体的二进制图的矩阵;输出该算法的输出为Y,即经过.原创 2021-10-03 13:55:06 · 632 阅读 · 0 评论 -
读《Transfer learning across ontologies forphenome–genome association prediction》
摘要一、动机为了更好地预测和分析基因与表型本体(phenotype ontology)中组织的表型集合的基因关联,有效地对本体中表型之间的分层结构进行建模并利用稀疏的已知关联是至关重要的。首先,本文引入了双标签传播(DLP),在预测人类表型本体论(HPO)中的表型-基因(phenotype-gene)关联时,对整个表型路径施加一致关联。然后,将DLP作为迁移学习框架中(tlDLP)的基础模型,来整合基因本体论(GO)中的功能注释。通过同时重建蛋白质-蛋白质相互作用网络(PPI Networ.原创 2021-10-01 20:56:16 · 313 阅读 · 0 评论