生物信息
文章平均质量分 95
https://www.youtube.com/playlist?list=PLypiXJdtIca5sxV7aE3-PS9fYX3vUdIOX
丸丸丸子w
生物信息
展开
-
生物信息学 GO、KEGG
概述了当前生物信息学领域中几个重要的概念和工具,介绍基因本体论(Gene Ontology, GO)、分子通路知识库KEGG(Kyoto Encyclopedia of Genes and Genomes)以及分子通路鉴定和GO注释的过程。首先从北京大学生物信息学团队的研究工作讲起,解释了基因本体论的框架,它是一套用于表示基因产品属性的控制词汇表。然深入探讨了KEGG数据库如何系统地整合了生物化学通路和分子交互网络的信息。原创 2024-03-25 23:55:51 · 1286 阅读 · 0 评论 -
生物信息—数据库
概述了几种主要的生物信息学数据库,包括核酸序列、蛋白质序列及其结构和专用生物路径数据库。文章从一级核酸数据库开始,详细介绍了GenBank、Ensemble和JCVI等数据库,这些数据库提供了广泛的原核和真核生物的遗传信息。然后是蛋白质数据库,从UniProtKB的基本序列信息到PDB的三维结构信息,以及如Pfam、Cath和SCOP2等二级蛋白质数据库的深入分析。最后,探讨了KEGG和OMIM等专用数据库,提供了详细的生物化学路径和遗传疾病信息。原创 2024-03-25 23:17:13 · 1054 阅读 · 0 评论 -
【Human Genetics】Link analysis、GWAS
这部分笔记介绍了人类遗传学的基础,并探讨了疾病基因狩猎的策略,包括评估常见和罕见变异、利用连锁分析识别遗传位点,以及通过全基因组关联研究(GWAS)测试基因与疾病之间的关联。重点强调了在GWAS中进行多重测试的重要性,并以克罗恩病为例说明了这些方法如何在具体疾病中应用。人类遗传学。原创 2024-02-06 12:29:07 · 842 阅读 · 0 评论 -
【Single Cell Genomics】Part3 Deep generative models for single-cell transcriptomics
然而,对于复杂的模型,这个分布可能是无法解析计算的,因为它涉及到高维积分,这在数学上称为不可解析或不可逾越。一旦得到了准确的信号,就可以用来做很多不同的生物学分析,比如找出哪些基因的活跃程度在不同的条件下会变化。这个简单的分布被选为容易计算的分布,通常是因子分解的(意味着它由更小的分布的乘积组成),并且有足够的灵活性来近似真实的后验分布。scANVI旨在提供一个统一的框架来处理单细胞数据的整合和注释,可能是通过学习数据的生成模型来实现的,并且可以在没有额外信息的情况下估计差异表达。跟第二部分比较类似。原创 2024-02-01 13:48:32 · 828 阅读 · 0 评论 -
【Single Cell Genomics】Part2 Deep representation learning (form theislab)
来自Manolis Kellis教授(MIT计算生物学主任)的课Slides:本节课是三个部分,这篇是第二部分。本部分是邀请Fabian Theis来介绍单细胞组学领域相关的工作。作为这个领域的开拓者之一,其主要的工作的介绍基本涵盖了这方面的分析流程。原创 2024-01-25 17:26:59 · 979 阅读 · 0 评论 -
【Single Cell Genomics】Part1 单细胞基因组学
来自Manolis Kellis教授(MIT计算生物学主任)的课Slides:本节课是三个部分,这篇是第一部分。本节课讲的是单细胞基因组学方面的分析,第一部分是一些基础知识的介绍,第二、第三部分是请了领域里的大佬来介绍相关的工作,比如Fabian Theis。首先回顾传统基因组学方法,以及为何scRNA-seq技术对于理解生物学的微观复杂性十分重要。然后讨论单细胞技术的快速进展,以及如何扩展这些技术以处理更大规模的数据集。扩展介绍了scATAC-seq和多组学数据的整合。原创 2024-01-25 17:23:09 · 1249 阅读 · 0 评论 -
【Gene Expression Prediction】Part4 Predicting splicing from primary sequence
来自Manolis Kellis教授(MIT计算生物学主任)的课Slides:本节课分为四个部分,本篇笔记是第四部分。主要介绍了SpliceAI这个模型如何从基本序列预测RNA的剪接。首先简要介绍RNA剪接的基本概念,然后详细讲解如何运用深度学习技术解码剪接过程。介绍了模型的性能,如何解释它们的预测结果,以及它们在实际应用中如何帮助我们更好地理解遗传疾病和开发新的治疗策略。原创 2024-01-24 14:00:00 · 1722 阅读 · 0 评论 -
【Gene Expression Prediction】Part3 Deep Learning in Gene Expression Analysis
来自Manolis Kellis教授(MIT计算生物学主任)的课Slides:本节课分为四个部分,本篇笔记是第三部分。主要是Xie Lab的一个讲座,讨论其组里的一些工作。在基因表达分析中应用深度学习。从介绍D-GEX开始,用于从关键基因预测基因表达的模型。接下来,将深度生成模型在基因组学中的应用,包括流形假设、自编码器,以及变分自编码器。此外,还介绍SAILER,这是一种基于单细胞ATAC-seq数据的模型,以及VAE。最后探索了多模态深度学习在单细胞多组学中的应用。原创 2024-01-23 14:21:35 · 1036 阅读 · 0 评论 -
【Gene Expression Prediction】Part2 Enchancer discovery
来自Manolis Kellis教授(MIT计算生物学主任)的课Slides:本节课分为四个部分,本篇笔记是第二部分。本节主要是一个讲座STARR-seq,探讨发现增强子的方法。如何利用弱监督学习检测增强子。评估了模型性能,以及它们在基因表达分析中的应用潜力。原创 2024-01-23 14:10:29 · 855 阅读 · 0 评论 -
【Gene Expression Prediction】Part1 基因表达数据的获取与分析
来自Manolis Kellis教授(MIT计算生物学主任)的课Slides:本节课分为四个部分,本篇笔记是第一部分。本节主要是介绍如何获得和分析基因表达数据。主要是为了后面的三个讲座铺垫。首先,探讨不同的方法和技术来获取基因表达数据。之后学习如何分析这些数据,包括上采样方法来解决数据不平衡问题,以及压缩感知技术来处理高维数据。最后,我们会讨论如何预测RNA剪接。原创 2024-01-22 12:00:00 · 943 阅读 · 0 评论 -
基因表达分析聚类&分析
两种分类方法在分类问题中,通常有两种主要的方法:生成方法(Generative)和判别方法(Discriminative)。生成方法(Generative)生成方法试图学习数据的联合概率分布P(X, Y),然后使用贝叶斯定理来推导出条件概率分布P(Y|X)。生成模型能够产生新的数据样本,这是它们名字的由来。代表性的算法有贝叶斯分类器(例如朴素贝叶斯)和隐藏马尔可夫模型(HMM)等。生成模型将分类问题描述为概率问题,它在不同类别中建模特征分布,并使用概率计算进行决策。原创 2024-01-22 12:00:00 · 1149 阅读 · 0 评论 -
【Regulatory Genomics】Part3 GENOMICS AT NVIDIA、ATACWORKS
来自Manolis Kellis教授(MIT计算生物学主任)的课本节课分为三个部分,本篇笔记是第三部分。本节主要是介绍了英伟达在基因组学方面的一些工作,主要介绍了ATACWORKS这个模型。用于在有噪声的、有数据质量问题、分辨率低的数据,还原成清晰的测序数据。原创 2023-12-11 18:46:14 · 88 阅读 · 0 评论 -
【Regulatory Genomics】Part2 BPNet、DeepLIFT
来自Manolis Kellis教授(MIT计算生物学主任)的课本节课分为三个部分,本篇笔记是第二部分。本节主要是请了一个阿三哥来介绍来一下他们的一些将神经网络应用在调控基因组学上的工作,模型的原理、意义和拓展。模型叫BPNet、DeepLIFT以及TF-MoDISCO。并且在实验上验证了他。整体思路递进的还不错,但是讲的有点快和凌乱,我感觉不如下一部分英伟达的讲座。原创 2023-11-15 12:58:03 · 192 阅读 · 0 评论 -
【Regulatory Genomics】Part1基因调控的生物学基础、motifs与测序技术
来自Manolis Kellis教授(MIT计算生物学主任)的课本节课分为三个部分,本篇笔记是第一部分。本节探讨基因调控的生物学基础、DNA motifs以及用于探测基因调控的关键技术(CHIP-seq、DNase-seq以及ATAC-seq)。主要是为后面的内容打下基础,为深度学习所用的数据进行说明。原创 2023-11-15 12:46:43 · 114 阅读 · 0 评论 -
【RNA folding】RNA折叠算法与生物物理约束
来自Manolis Kellis教授(MIT计算生物学主任)的课。本节课分为三个部分,本篇笔记是第三部分RNA folding。本课程探讨RNA的折叠过程及其预测方法。先了解了RNA的表示和Nussinov算法的应用。然后通过动态规划预测复杂的RNA叠加与折叠。最后介绍了随机上下文无关文法,为RNA结构提供了广泛的描述框架。原创 2023-10-22 17:34:40 · 1120 阅读 · 0 评论 -
【RNA structures】RNA-seq 分析: RNA转录的重构和前沿测序技术
来自Manolis Kellis教授(MIT计算生物学主任)的课。本节课分为三个部分,本篇笔记是第二部分RNA structures。本部分深入研究了RNA转录的重构和测序技术。从RNA转录重构的基础开始,探讨了现代测序技术的应用。原创 2023-10-21 21:21:42 · 2110 阅读 · 0 评论 -
【RNA world】RNA的多功能性与早期生命进化
来自Manolis Kellis教授(MIT计算生物学主任)的课本节课分为三个部分,本篇笔记是第一部分RNA world。主要探讨了RNA分子的功能多样性和RNA在生物学中的核心功能。从RNA在生物学中的中心法则的核心功能开始,深入探讨了rRNA、SnRNA等RNA的不同功能。此外,还介绍了RNA世界假说、RNA的复制、催化作用,以及RNA如何感知环境变化并作出相应的反应。原创 2023-10-21 21:04:20 · 331 阅读 · 0 评论 -
表示学习(Representation Learning) Part2--Auto-Encoders、VAEs、GANs
来自Manolis Kellis教授(MIT计算生物学主任)的课《人工智能与机器学习》主要内容是表示学习(Representation Learning)的part2----压缩(自动编码器)、捕捉参数分布(VAE)、使用第二个网络(GAN)三种方式来进行Representation Learning原创 2023-06-14 18:48:51 · 834 阅读 · 0 评论 -
表示学习(Representation Learning) Part1--Pretext Text
来自Manolis Kellis教授(MIT计算生物学主任)的课《人工智能与机器学习》。主要内容是表示学习(Representation Learning)的part1----Pretext Text(代理任务/前置任务/辅助任务等等),可以理解为是一种为达到特定训练任务而设计的间接任务。。包括这几个部分:推断结构、转换预测、重构、利用时间、多模态、实例分类(对应英文见目录)原创 2023-06-09 00:21:23 · 453 阅读 · 0 评论 -
NLP基础知识(语法语义、LDA、N-gram、词嵌入)
来自Manolis Kellis教授(MIT计算生物学主任)的课《人工智能与机器学习》。本文是NLP的铺垫,很多基础的知识,讲的主要是传统的一些方法,对于深入现代的RNN、LSTM、BERT、Transformer、GPT等等模型可以说是必备的。主要讲了文本的语法和语义关系、不确定性(医学文本)、LDA主题模型、N-gram models、词嵌入是啥(embedding)。解决了我以前只学模型的一些困惑。最后粗略的过了一下大语言模型(LLMs)并给出了几个好的视频链接(台大李宏毅)。原创 2023-05-29 23:45:01 · 805 阅读 · 0 评论 -
【生物信息】调控基因组学 (Regulatory Genomics) 和Deep CNN
来自Manolis Kellis教授(MIT计算生物学主任)的课《人工智能与机器学习》。主要内容就是调控基因组学和深度卷积网络的结合原创 2023-05-24 19:57:36 · 847 阅读 · 0 评论 -
生成模型(自编码器、VAE、GAN)
来自Manolis Kellis教授(MIT计算生物学主任)的课《人工智能与机器学习》,中间结合李沐的一个精读视频(GAN)作为补充。主要内容就是生成模型,包括自编码器(Autoencoder)、变分自编码器(VAE)和生成对抗网络(GAN)。由于这部分在我学习的课程中不到15分钟,所以内容很少,下面贴出油管链接(这个有一个半小时)原创 2023-05-24 19:54:12 · 2093 阅读 · 0 评论 -
图神经网络GNN GCN AlphaFold2 虚拟药物筛选和新药设计
来自Manolis Kellis教授的课《人工智能与机器学习》,中间结合李沐老师的两个精读视频(GNN和AlphaFold2)作为补充。本节课主要介绍了几何深度学习、图神经网络主要内容有图神经网络、GNN、GCN、对称性、等变性、信息传递、蛋白质空间结构预测(AlphaFold2)、药物设计(虚拟药物筛选和新药设计)。原创 2023-05-23 23:16:35 · 1498 阅读 · 0 评论 -
网络分析和机器学习
来自Manolis Kellis教授(MIT计算生物学主任)的课《人工智能与机器学习》。本节课主要介绍了network和graph的知识。主要内容有网络和图的基础知识(网络类型、相关算法)、网络性质(motifs性质、中心性等)、特征向量、SVD奇异值分解、PCA、Sparse PCA、t-SNE等。我觉得讲的很好!短短一个半小时讲的比我大一学的线性代数有意思多了,很有启发,尽管我的线性代数很烂但不妨碍边学边查最后大概都能听懂。原创 2023-05-21 15:57:23 · 939 阅读 · 0 评论 -
【生物信息】用隐马尔可夫模型对生物序列进行建模
来自Manolis Kellis教授的课教了隐马尔可夫在基因组学中的一些应用重点介绍了隐含状态序列解码问题至于序列概率估计和求解参数问题没有细讲。原创 2023-04-19 12:55:46 · 848 阅读 · 1 评论