生物信息学
盲人骑瞎马5555
努力搬砖~
间歇性发奋图强~
展开
-
关于sPLS analysis的一些学习
sPLS:Sparse partial least-squares regression 稀疏偏最小二乘回归最小二乘法,又称最小平方法,是一种数学优化建模方法。它通过最小化误差的平方和寻找数据的最佳函数匹配。 利用最小二乘法可以简便的求得未知的数据,并使得求得的数据与实际数据之间误差的平方和为最小。 “最小二乘法”是对线性方程组,即方程个数比未知数更多的方程组,以回归分析求得近似解的标准方法。最小二乘法,所谓“二乘”就是平方的意思,就是最小化误差的平方。首先什么是最小二乘回归?其实就是多元线性回..原创 2021-03-30 10:04:24 · 1950 阅读 · 0 评论 -
《生物信息学》阅读笔记 (四):非编码RNA
除mRNA以外,生物体内还存在许多不编码蛋白质的RNA,直接在RNA水平发挥作用,称为非编码RNA(non-coding RNA, ncRNA)。 细胞中含量最高的rRNA和tRNA这两种常见的非编码RNA,广义上ncRNA包含这两种研究的非常透彻的RNA,但是狭义上往往不包括。 最近研究表明很多非编码RNA具有很重要的功能,其中突出和核心的作用是调控。 ncRNA若长度小于200nt,为短链RNA,若大于200nt则为长链RNA。 RNA的调控网络可能决定我们大多数复杂的特性,并在疾病中发挥重要作原创 2021-03-28 08:08:20 · 1759 阅读 · 0 评论 -
《生物信息学》阅读笔记 (三):序列比对原理
这一章之前在博客中就有过介绍。这里是查漏补缺。运用全局比对的主要优势在于对具有高度同源性的序列进行优化,这在以已知三维结构的同源性序列为基础对未知序列的三维结构进行预测的模型构建中是十分有用的。 局部比对适合用于哪些在其全长中具有局部的小同源性片段的序列比较,一般用于特定序列位点、结构域及其他类型重复序列的搜索,同时它在发现数据库中待分析序列的同源序列过程中也有重要意义。 相似性(similarity)是指两序列间直接的数量关系,如部分相同、相似的百分比或其他一些合适的度量。 同一性(identi原创 2021-03-21 15:48:29 · 2720 阅读 · 0 评论 -
《生物信息学》阅读笔记 (二):生物学数据库及其检索
目前生物学数据库的四种类型:平面文件、关系型数据库、面向对象数据库和基于Internet平台的XML。 人类基因组计划的主要目标:获取完整、准确、高质量的人类基因组序列。 生物学数据存放类型:序列、三维结构、文献、序列特征、基因组图谱、表达谱等。 二级数据库则是在一级数据库的信息基础上进行了计算加工处理并增加了许多人为的注释而构成的。如何查找与研究相关的生物学资源:利用公共搜索引擎 了解重要的生物信息学门户站点:NCBI、EBI、EMBnet 利用Nucleic Acid Research原创 2021-03-17 23:19:58 · 1223 阅读 · 0 评论 -
《生物信息学》阅读笔记 (一):生物信息学的概念及发展历史
《生物信息学》第三版 (陈铭 主编)表1-1 生命科学、计算机科学及生物信息学相关大事记,可以查阅此表了解相关历史。学习一门学科一个很重要的point就是了解这门学科的历史。生物信息学的研究领域有:分子生物学与细胞生物学 生物物理学 脑和神经科学 医药学 农林牧渔学 分子和生态进化生物信息学的主要应用:(一)生物信息学数据库数据库建设 数据库整合和数据挖掘(二)序列分析序列比对 基因序列注释(三)其他主要应用比较基因组学 基因和蛋白质的表达分析 生物芯片大规原创 2021-03-03 09:13:50 · 4482 阅读 · 0 评论 -
chapter10-batch effects
chapter10-batch effects1.Introduction to batch effects [Rmd]batch effects 产生的原因:measurements are affected by laboratory conditions, reagent lots 试剂批号, and personnel differences. 本章中将介绍:how to de...原创 2020-01-31 21:42:00 · 314 阅读 · 0 评论 -
NCBI SRA数据库使用详解----学习笔记
SRA(Sequence ReadArchive)数据库是用于存储二代测序的原始数据,包括454,Illumina,SOLiD,lonTorrent, Helicos和CompleteGenomics。除了原始序列数据外,SRA现在也存在raw reads在参考基因的比对信息。 根据SRA数据产生的特点,将SRA数据分为四类:studies--研究课题 experiments--实验设计 ...原创 2019-12-25 15:58:47 · 3663 阅读 · 0 评论 -
OTU的定义与解读----了解笔记
OTU: Operational Taxonomic Unit 操作分类单元 OTU的提出目标是指定一个定量策略,根据观察到的特征将生物分类成组,创建一个层次分类,尽可能忠实地反映生物之间的进化关系。 在16S测序中,OTU通常使用97%的identity threshold。 16S序列的97%相似性大约相当于70%的DNA重新关联值(DNA reassociation value) 2...原创 2019-11-17 17:55:10 · 8916 阅读 · 1 评论 -
《生物化学与分子生物学》----糖代谢---听课笔记(十七)
第二十五章戍糖磷酸途径和糖的其他代谢途径8.4.1 戍糖磷酸途径和糖的其他代谢途径(1)戊糖磷酸途径:是糖代谢的第二条途径;在细胞浆中进行;广泛存在于动植物细胞内。 磷酸戊糖途径是指由葡萄糖生成磷酸戊糖及前者在进一步转变成3-磷酸甘油醛和果糖-6-磷酸的反应过程。 磷酸戊糖途径又称戊糖支路,己糖单磷酸途径、磷酸葡糖酸氧化途径、戊糖磷酸循环 磷酸戊糖途径的生理意义:产生大量NAD...原创 2019-11-06 13:02:29 · 909 阅读 · 0 评论 -
《生物化学与分子生物学》----生物氧化---听课笔记(十六)
第二十四章生物氧化——电子传递和氧化磷酸化8.3.1 生物氧化——电子传递和氧化磷酸化(1)生物氧化:有机分子在有机体氧化分解成二氧化碳和水并释放能量的过程。 在活的细胞中(pH接近中性、体温条件下),有机物的氧化在一系列酶、辅酶和中间传递体参与下进行,其途径迂回曲折,有条不紊。 还原性辅酶上氢原子以质子的形式脱下,其电子沿一系列按一定顺序排列的电子传递体转移,最后转移给分子氧并生...原创 2019-11-05 08:17:45 · 816 阅读 · 0 评论 -
《生物化学与分子生物学》----糖酵解,柠檬酸---听课笔记(十五)
第二十二章 糖酵解作用 Glycolysis8.1.1 糖酵解作用(1)糖酵解是葡萄糖在无氧条件下降解为丙酮酸并伴随ATP生成的过程。是一切有机体中普遍存在的葡萄糖降解途径。 葡萄糖亦经酵母汁作用产生酒精。酵母汁的发酵能力远远不如活酵母菌。并且酵母汁放置的时间越长,其发酵能力越弱。 糖酵解过程可分为两个阶段(共10步反应):准备阶段:1葡萄糖---->2分子丙糖磷酸(-2AT...原创 2019-11-02 08:56:35 · 3069 阅读 · 0 评论 -
《生物化学与分子生物学》----代谢总论---听课笔记(十四)
第十九章 代谢总论7.1.1 代谢总论(1)新陈代谢简称代谢,是指生物体与周围环境进行物质和能量交换的过程,也是活细胞内所有化学变化的总称。 生物体内酶催化的化学反应是连续的,前一种酶作用的产物往往是后一种酶作用的底物,这种在代谢过程中连续转变的酶促反应产物统称为中间产物或简称代谢物。 每种代谢作用都包含两个方面:物质代谢:物质的合成与分解; 能量代谢:能量的转换、储存和释放。...原创 2019-10-30 14:36:25 · 603 阅读 · 0 评论 -
《生物化学与分子生物学》----核酸----听课笔记(十三)
第十四章 核酸的物理化学性质6.3.1 核酸的物理化学性质(1)对酸的敏感性:糖苷键>磷酸酯键; 嘌呤糖苷键>嘧啶糖苷键 利用酸水解可以研究核酸的碱基组成 RNA的磷酸酯键对碱敏感 DNA抗碱水解:DNA更稳定,遗传信息;RNA是DNA的信使,完成任务后迅速降解。 酶水解:非特异的磷酸二酯酶 蛇毒磷酸二酯酶水解DNA、RNA,得5' -核苷酸 牛脾磷酸二酯酶水解D...原创 2019-10-21 14:15:12 · 1508 阅读 · 0 评论 -
《生物化学与分子生物学》----核酸----听课笔记(十二)
第十二章 核酸通论6.1.1 核酸通论(1)核酸(Nucleic acids)是一类重要的生物大分子,担负着生命信息的储存和传递。 核酸是现代生物化学、分子生物学的重要研究对象和领域。 核酸的发现和研究历史 1868 Miescher从脓细胞的细胞核中分离出了一种含磷酸的有机物,当时称为核素(nuclein)。 1879年Kossel经过10年的努力,搞清楚核素中有四种不同的组成...原创 2019-10-20 14:35:58 · 2331 阅读 · 0 评论 -
《生物化学与分子生物学》----酶的作用机理和酶的调节----听课笔记(十一)
第十章酶的作用机理和酶的调节5.3.5 酶的作用机理和酶的调节(5)酶活性的调节控制 别构调控:酶分子的非催化部位与某些化合物可逆地非共价结合后发生构象的变化,进而改变酶的活性状态,称别构调节。具有这种调节作用的酶称别构酶或变构酶。 凡能使酶分子发生别构作用的物质称为效应物或别构剂,通常为小分子代谢物或辅因子。 如因别构导致酶活性增加的物质称为正效应物或别构激活剂。反之称为负效应...原创 2019-10-18 21:08:14 · 4911 阅读 · 0 评论 -
《生物化学与分子生物学》----酶的作用机理和酶的调节----听课笔记(十)
第十章 酶的作用机理和酶的调节5.3.1 酶的作用机理和酶的调节(1)酶的活性部位(active site)也叫酶的活性中心(active center),指酶分子上结合底物和将底物转化为产物的区域。 酶的活性部位包含:结合部位(binding site)和催化部位(catalytic site). 结合部位:酶分子中与底物结合的部位或区域一般称为结合部位。此部位决定酶的专一性。...原创 2019-10-17 17:49:52 · 2911 阅读 · 0 评论 -
《生物化学与分子生物学》----酶促反应动力学----听课笔记(九)
第九章 酶促反应动力学5.2.1 酶促反应动力学(1)酶促反应动力学是研究酶促反应的速率以及影响此速率的各种因素的科学。 酶与底物的中间络合物学说:在低底物浓度时,反应速度与底物浓度成正比,表现为一级反应特征。 随底物浓度增加,反应速度不再呈正比例增加,表现为混合级反应。 当底物浓度达到一定值,反应速度达到最大值,此时再增加底物浓度,反应速度不再在增加,表现为零级反应。 提出学...原创 2019-10-17 14:05:00 · 5800 阅读 · 0 评论 -
《生物化学与分子生物学》----酶----听课笔记(八)
第八章 酶通论5.1.1 酶通论(1)酶始于19世纪对发酵过程的研究:1810年,Gaylussac发现,酵母可使糖转化为酒精。 1897年,Buchner兄弟用不含细胞的酵母汁成功实现了发酵。提出了发酵与活细胞无关,而与细胞液中的酶有关。 1982年,Cech和Altman对四膜虫的研究中发现RNA具有催化作用,从而发现核酶(ribozyme),打破了以往酶是蛋白质的传统观念。获诺...原创 2019-10-16 16:31:42 · 2570 阅读 · 0 评论 -
《生物化学与分子生物学》----蛋白质----听课笔记(七)
第六章 蛋白质结构与功能的关系4.4.1 蛋白质结构与功能的关系(1)同源蛋白质的物种差异与生物进化 不同物种中行使相同或相似功能的蛋白质称同源蛋白质(homologous proteins),如脊椎动物中的血红蛋白。 同源蛋白质中氨基酸序列具有明显的相似性,这种相似性叫序列同源性(sequence homology) 同源蛋白质的氨基酸序列有许多位置的氨基酸残基对许多物种是相同的...原创 2019-10-15 19:39:48 · 3426 阅读 · 0 评论 -
《生物化学与分子生物学》----蛋白质----听课笔记(六)
第五章 蛋白质的三维结构4.3.1 蛋白质的三维结构(1)蛋白质是由多肽链折叠而成的,具有特殊的空间结构和生物学功能。 蛋白质的空间结构即蛋白质的构象,指蛋白质分子所有原子在三维空间(x,y,z)的位置。 蛋白质结构的层次:1°结构:蛋白质多肽链中氨基酸残基的排列顺序; 2°结构:蛋白质多肽链主链的折叠方式; 3°结构:蛋白质一条多肽链的折叠; 4°结构:寡聚蛋白质各亚基的空...原创 2019-10-14 19:50:13 · 4200 阅读 · 0 评论 -
《生物化学与分子生物学》----蛋白质----听课笔记(五)
第四章 蛋白质4.2.1 蛋白质的共价结构(1)蛋白质是生活细胞内含量含量最丰富的、功能最复杂的生物大分子,并参与了几乎所有的生命活动和生命过程。因此,研究蛋白质的结构与功能始终是生命科学最基本的命题。蛋白质的元素组成与分类蛋白质的主要元素组成:C、H、O、N、S及P、Fe、Cu、Zn、Mo、I、Se等元素。 蛋白质评价含N量为16%,这是凯氏(Kajedahl)定氮测蛋白质含量...原创 2019-10-13 13:49:21 · 1453 阅读 · 0 评论 -
《生物化学与分子生物学》----蛋白质----听课笔记(四)
第三章 氨基酸 (但是好像氨基酸部分少了很多视频~)4.1.1 氨基酸(1)蛋白质氨基酸:蛋白质中常见的20种氨基酸,称蛋白质氨基酸、基本氨基酸、标准氨基酸或编码氨基酸。 稀有的蛋白质氨基酸:蛋白质组成中,除上述20种常见氨基酸外,从少数蛋白质中还分离出一些稀有氨基酸,它们都是相应常见氨基酸的衍生物。如4-羟脯氨酸、5-羟赖氨酸。 非蛋白质氨基酸:生物体内呈游离或结合态的氨基酸...原创 2019-10-09 15:33:03 · 1157 阅读 · 0 评论 -
《生物信息学:导论与方法》--本体论、分子通路鉴定--听课笔记(十九)
第九章本体论、分子通路鉴定9.4 分子通路鉴定You have got a set of genes or proteins from your experiments. How can you find out which pathways the proteins belong to? How can you find out which were the most signi...原创 2019-09-25 18:15:16 · 510 阅读 · 0 评论 -
《生物信息学:导论与方法》----马尔可夫模型----听课笔记(六)
第四章马尔可夫模型4.1 从状态到马尔可夫链Markov链是由俄国数学家引入的,一个基于概率的随机过程模型,用来刻画一组之间存在关联的随机事件。 具体来说,Markov链用来描述一组离散状态之间在不同时刻的转移关系,并且注意,这里的状态转移关系不需要是唯一确定的,只需要一个概率分布描述即可。 Markov唯一的要求是:t时刻状态的概率分布,由且只由之前有限的m个时刻状态的概率分布确...原创 2019-09-11 18:31:36 · 1083 阅读 · 0 评论 -
《生物化学与分子生物学》----脂质----听课笔记(三)
第二章 脂质3.1 脂质(1)脂质:不溶于水、溶于非极性溶剂的生物有机分子。 按化学组成分类:单纯脂质(甘油三酯、蜡)、复合脂质(磷脂、糖脂)、衍生脂质(取代烃、固醇类、萜和其他脂质) 按极性分类:非极性脂质(水不溶性,不能形成単分子层。);I 类极性脂质(能参入膜,但自身不能形成膜,如三酰甘油、胆固醇等);II 类极性脂质(能形成膜,如磷脂和鞘糖脂);III 类极性脂质(具可溶性)...原创 2019-10-08 21:57:57 · 3822 阅读 · 0 评论 -
《生物化学与分子生物学》----糖类----听课笔记(二)
第一章 糖类(Carbohydrate)2.1 糖类(1)糖类的存在与来源:糖类是地球上最丰富的的有机化合物,植物体85%~90%的干重是糖类,地球上的生物量(Biomass)干重的50%以上是由葡萄糖的聚合物构成的。糖类的根本来源是绿色细胞的光合作用。 糖类的生物学作用:结构物质、能源物质、中间代谢物、信息分子 糖类的元素组成和化学本质:糖类主要由C、H、O三种元素组成,有些还有N、...原创 2019-10-07 15:17:47 · 3318 阅读 · 0 评论 -
《生物化学与分子生物学》----绪论----听课笔记(一)
[华中科技大学]生物化学与分子生物学绪论1.1 生物化学与分子生物学绪论(1)生物化学(Biochemistry、Biological chemistry): 研究生物体(微生物、植物、动物及人体)的化学组成和生命过程中的化学变化规律的科学。 分子生物学(Molecular Biology):生物化学有机地融合了微生物学、遗传学和细胞生物学的有关知识----形成了现代的分子生物学。它...原创 2019-10-06 14:20:12 · 2126 阅读 · 0 评论 -
《生物信息学:导论与方法》----变异的功能预测----听课笔记(十一)
第六章变异的功能预测6.1 问题概述Where did your genetic variations come from?inherited from parents de novo mutations(70~100个新发突变) somatic mutations(体细胞突变,如癌症)有很多的先天的小儿疾病,就是这个孩子有一个De novo mutation,刚好落在了一个重...原创 2019-09-17 22:25:50 · 4024 阅读 · 1 评论 -
《生物信息学:导论与方法》----新一代测序NGS:重测序的回帖和变异鉴定----听课笔记(十)
第五章 新一代测序5.7 3730 Sanger测序介绍Sanger测序法是经典的第一代DNA测序法,它的特点是操作简单,读长长,但是通量较低。 在一个Sanger测序反应体系中,包括DNA片断,脱氧三磷酸核苷酸(dNTP), 双脱氧三磷酸(ddNTP),测序引物及DNA聚合酶等。 测序反应的核心就是其使用的双脱氧三磷酸核苷酸由于缺少3'-OH基团,不具有与另一个dNTP连接形成磷酸...原创 2019-09-16 10:21:42 · 386 阅读 · 0 评论 -
《生物信息学:导论与方法》----新一代测序NGS:重测序的回帖和变异鉴定----听课笔记(九)
第五章新一代测序NGS5.4 关于回帖、变异鉴定的补充材料BWT算法是BWA软件所使用的压缩算法,它可以对数据进行无损压缩,它对字符串乱转后得到的字符矩阵进行排序和变换,使数据更容易被压缩。 BWT算法利用逆字符的方法去检验是否存在相同(匹配)的区域,它不能处理gap。 L列和F列的两个性质:L列的序列是其所对应的F列的序列在原始序列中的前一位。 L列中字母出现的顺序和F中的相...原创 2019-09-15 22:39:26 · 634 阅读 · 0 评论 -
《生物信息学:导论与方法》----新一代测序NGS:重测序的回帖和变异鉴定----听课笔记(八)
第五章新一代测序NGS:重测序的回帖和变异鉴定5.1 新一代测序从二十世纪前,人类认识到DNA的重要性后,一直以来将测序----确定一个特定DNA分子的序列----作为理解生命的重要方法。 真正可以大规模运用的核酸测序方法,是1977年由英国生物化学家Frederick Sanger提出并实现. Sanger测序法的广泛应用使得大规模测定基因组序列成为可能,并为人类最终在20世纪...原创 2019-09-14 16:29:11 · 1982 阅读 · 0 评论 -
《生物信息学:导论与方法》----马尔可夫模型----听课笔记(七)
第四章 马尔科夫模型4.4 学生课堂报告1Example1: Was she happy? 非常有意思的例子。。。hidden_states = (Happy, Unhappy) observations = (Kiss, Beat, Do nothing) Viterbi算法 Example2: 5’ splice site recognition-----hidden_stat...原创 2019-09-12 11:14:56 · 355 阅读 · 0 评论 -
《生物信息学:导论与方法》----序列数据库搜索----听课笔记(五)
第三章 序列数据库搜索3.1 序列数据库Sequence Database Searching Rather than do the alignment pair-wise, it's more often to search sequence database in a high-througnput style. Or, identify similarities betwee...原创 2019-09-10 16:54:18 · 684 阅读 · 0 评论 -
《生物信息学:导论与方法》----序列对比----听课笔记(四)
第二章 序列对比2.6 学生课堂报告1序列对比有两个特性:分解为重叠子问题和优化之后能得到最小子结构,这两个正好符合动态规划的思路。 Needleman-Wunsch算法的打分矩阵填充并不一定要从左上角到右下角,也可以从右下角到左上角,凭个人喜好。 Whether a particular result differs significance from a fortuitous(偶...原创 2019-09-09 22:34:20 · 455 阅读 · 0 评论 -
《生物信息学:导论与方法》----序列对比----听课笔记(三)
第二章 序列对比2.4 考虑仿射空位罚分的序列对比,以及如何计算Needleman-Wunsch算法的时间复杂度在之前介绍的全局和句对对比算法中,对于空位罚分都没有区分gap open和gap extending,而令其统一等于了一个值d。Why? 要正确区分gap open和gap extending,就需要引入状态的概念。 之前提到一对残基对比的状态只有三种,因此定义:M(Mat...原创 2019-09-08 10:46:08 · 1693 阅读 · 0 评论 -
《生物信息学:导论与方法》----序列对比----听课笔记(二)
第二章 序列对比2.1 序列对比中的基本概念在没有充分对相关原理进行理解的情况下,盲目的使用工具,就会有称为被工具使用的“人标”的危险。 知其道,用其妙。 对于每一类方法可以从以下几个方面来进行介绍:Biology----What is the biological question or problem? 也就是这个方法要解决的生物学问题和背景是什么,或者说“为什么需要这个方法...原创 2019-09-07 17:09:44 · 976 阅读 · 0 评论 -
《生物信息学:导论与方法》----导论与历史----听课笔记(一)
北京大学----生物信息学:导论与方法(2013?)第一章 导论与历史1.1 什么是生物信息学基因组就是ATCG这四个字母的简单的重复 人的基因组一共有31亿个碱基对,里面只有2.9%是编码蛋白的基因区间。 高等生物有大量的可变剪切,一个基因可以有多个剪切体,翻译成多个蛋白。 整个世界上除了RNA病毒之外的其他的所有物种的基因组都是由ATCG这样简单的重复组成的。 核酸序列的增...原创 2019-09-06 11:30:46 · 939 阅读 · 0 评论 -
《生物信息学:导论与方法》----变异的功能预测----听课笔记(十二)
第六章 变异的功能预测6.4 基于机器学习分类器的预测方法:SAPREDSingle Amino acid Polymorphisms disease-association Predictore (SAPRED) PDB - get protein 3D structure Homology Modeling:如果感兴趣的蛋白没有已知结构,可以尝试同源建模,同源建模就是找到与你感兴...原创 2019-09-18 15:54:48 · 661 阅读 · 0 评论 -
《生物信息学:导论与方法》--非编码RNA的预测及分析--听课笔记(十三)
第七章 非编码RNA的预测及分析7.1 非编码RNA以非编码RNA为例,演示如何在RNA-Seq等转录组测序技术产生的RNA数据基础上进一步探索生物学问题。 在转录组中既包括大家早已熟悉的编码蛋白的信使RNA(mRNA),也包括近来新发现的、不编码蛋白的miRNA、long non-coding RNA(lncRNA)等非编码RNA。 这些RNA转录本彼此协同作用,共同来调控细胞生长...原创 2019-09-19 10:47:51 · 3004 阅读 · 0 评论 -
(课程完结)《生物信息学:导论与方法》--研究案例2-DNA甲基化酶的演化功能分析--听课笔记(二十四)
第十二章研究案例2-DNA甲基化酶的演化功能分析12.1 从干实验到湿实验----一个演化问题 第1部分在演化中,我们通常将同源基因根据其来源,进一步划分为直系同源基因(orthologs)和旁系同源基因(paralogs)。 直系同源基因是由物种分化事件(speciation)产生的,而后者则是由基因复制(gene duplication)的产物。所以父母和子女是直系亲属,兄弟姐妹...原创 2019-09-30 23:25:52 · 408 阅读 · 0 评论