自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 从jensen不等式到相对熵的非负性性

从jensen不等式到相对熵的非负性性 前言:在上上次博客我们证明观测到的归一化的频率就是最大似然估计的解时,我们用到了相对熵恒大于等于0的性质,那么本文就当是扩展一下知识,主要以证明和介绍为主。  首先我们简要介绍一下熵的概念。“熵”这一概念并不仅仅存在于物理化学中,还应用于信息论中。熵是结果不确定度的一种度量。shannon熵定义为:H(x)=−∑iP(xi)log⁡P(xi)H ( x...

2020-01-30 11:12:41 1754

原创 双序列比对的基础之PAM矩阵

双序列比对的基础之PAM矩阵 PAM矩阵的记分方法是基于蛋白序列中单点可接受(point accepted mutation, PAM)的概念,通过对蛋白质进化模式的研究而建立的。 PAM矩阵是由Dayhoff等人构建了与71个家族的序列关联的假想系统发育树,其中每对序列间的差异不超过它们残基总数的15%,用简约法建树,统计相似序列比对中的替换发生率来得到的。即,构建一个序列间相似度很高(通常...

2020-01-27 17:22:08 6436

原创 双序列比对的理论基础之建造替换矩阵的合理性证明

双序列比对的理论基础之建造替换矩阵的合理性证明 前言:如果对最大似然估计没有概念的话,可以看看我之前写的《似然,似然,似是而然》 结合前几篇文章我们大致的了解了计分矩阵的流程:对某以蛋白质家族进行多序列对比,然后按某一阈值(等同残基比)进行聚类,之后将匹配的无空位的区域划分为block,然后统计各个block中残基之间的联配的频率,用归一化的频率估计概率,进行最大似然估计,估计出在自然界中各残...

2020-01-26 17:59:42 338

原创 似然,似然,似是而然!

似然,似然,似是而然!1.1 似然是蛤?在统计学中,似然和概率可是两码事。 概率:在已知的模型下,某事件发生的可能性。 似然:在未知的模型下,发生了一系列的事件,有这些事件的结果去估计该未知模型的相关参数(条件)。 举一个小例子可能会更形象。现在我有一枚标准的硬币,我将它抛在了空中,这时我想知道它落地时是正面朝上的可能性是多少?毫无疑问,因为该硬币是标准的,正面和反面朝上的概率是~~ 五...

2020-01-21 17:58:31 323

原创 双序列比对的基础(2)之替换(计分)矩阵系列

双序列比对的基础(2)之替换(计分)矩阵系列  主要以BLOSUM矩阵与PAM矩阵的介绍为主。 声明:该部分书中内容介绍有点少,所以我上网搜索到几篇文献和和国外大学的相关课件(从一个研究生博主处获得)。那本篇文章就先介绍BLOSUM矩阵吧  BLOck SUBstitution Matrix:BLOSUM矩阵。 详细的来说,它们来自一组蛋白质家族中联配上的无空位区域,这些蛋白家族源于BL...

2020-01-17 19:11:49 5078 4

原创 双序列比对的理论基础(一)

双序列比对的理论基础(一)比对的具体流程:1使用字符串模拟生物序列,那么两条序列的相似性比对可看成两个字符串的对齐,运用特定的算法搜索所有可能的比对方案。2 采用具有生物学意义的打分机制(替换矩阵),衡量算法的比对结果,获得最优比对。1.1 字符模型的建立。两条序列x和y;长度分别为m和n;xi 表示序列x中的第i个字符。yi 表示序列y中的第i个字符。这些字符全部来自字母表Ω=...

2020-01-15 09:39:49 2002

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除