数学模型
文章平均质量分 69
子诚之
微信公众号:生信工程师的日常
展开
-
向量空间模型
1. 基础1.1 向量空间如果 V 满足向量的加法和乘法封闭性,我们就称 V 是 F 上的向量空间。1.2 向量间的距离曼哈顿距离欧氏距离切比雪夫距离闵氏距离1.3 向量长度L1 范数 ∣∣x∣∣ ,它是为 x 向量各个元素绝对值之和,对应于向量 x 和原点之间的曼哈顿距离。L2 范数 ∣∣x∣∣2 ,它是 x 向量各个元素平方和的 1/2 次方,对应于向量 x 和原点之间的欧氏距离。Lp 范数 ∣∣x∣∣p ,为 x 向量各个元素绝对值 p 次方和的 1/原创 2021-02-19 22:50:50 · 467 阅读 · 0 评论 -
显著性检验
1. 基本概念两组数据的差异可能来源于:(1) 分布差异。(2)抽样误差,见上图。其中由分布造成的差异被称作显著性差异。统计假设检验是指事先对随机变量的参数或总体分布做出一个假设(Null Hypothesis, H0),然后根据样本信息决定是否拒绝原假设。具体步骤如下。在原假设条件下,计算事件发生,即样本出现的概率(p value)。若概率小于显著性水平(α),则拒绝原假设;否则,接受原假设。显著性检验的原假设是多组数据来自于同一个分布。2. 种类2.1 t检验2.2 方差分析(ANO原创 2021-02-18 21:22:17 · 1976 阅读 · 0 评论 -
熵,决策树和特征选择
基本概念信息量信息量度量一个事件/一个随机变量具体值发生所带来的信息多少。一些性质信息量大于等于0。事件发生的概率与信息量成反比。相互独立事件 A, B 同时发生的信息量等于各自发生时的信息量之和。公式H(x)=−log2(x)H(x) = -log_2(x)H(x)=−log2(x)信息熵(entropy)信息熵度量所有可能事件/随机变量信息量的期望。n 表示集合中分组数量。pi 表示第 i 个分组的元素在集合中出现的概率。信息增益(Information gain原创 2021-02-16 22:44:51 · 336 阅读 · 0 评论 -
马尔科夫模型
马尔科夫模型(Markov Model)1. 假设每个状态出现的概率与之前出现的一个或若干个状态有关。或者说,每个状态按照一定概率转移到下个状态。需要观测到状态本身;或者观测到状态按一定概率分布所产生的输出。2. 模型2.1 马尔科夫链(一阶)状态之间转移概率。#mermaid-svg-Msg1k85yCTADGSjT .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-famil原创 2021-02-16 11:29:45 · 107 阅读 · 0 评论