![](https://img-blog.csdnimg.cn/47b0d57ef1e74d3bb3f8ccd405453eed.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
生物信息
文章平均质量分 87
学习生信基础、代码实现,追踪生信前沿问题.
优惠券已抵扣
余额抵扣
还需支付
¥59.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
GUI Research Group
机器学习, 生物信息
展开
-
生信文献记录(part6)--Iterative transfer learning with neural network for... in scRNA-seq analysis
聚类和细胞类型分类是单细胞RNA-seq(scRNA-seq)分析的重要步骤。随着越来越多的scRNA-seq数据的出现,利用外部良好注释的源数据的监督细胞类型分类方法开始比无监督聚类算法更受欢迎;然而,现有的监督方法的性能高度依赖于源数据的质量,它们对源数据中缺失的细胞类型分类的准确性往往有限。我们开发了ItClust来克服这些限制,这是一种迁移学习算法,借鉴了监督细胞类型分类算法的思路,但也利用了目标数据中的信息,以确保对只存在于目标数据中的细胞进行分类的敏感性。原创 2022-12-09 11:40:35 · 378 阅读 · 0 评论 -
生信文献记录(part7)--Clustering single-cell RNA-seq data with a model-based deep learning approach
单细胞RNA测序(scRNA-seq)有望提供比bulk RNA测序更高的细胞差异分辨率。通过scRNA-seq分析的转录组聚类已被常规化,以揭示细胞的异质性和多样性。然而,scRNA-seq数据的聚类分析仍然是一个统计和计算方面的挑战,因为普遍存在的drop-out事件使数据矩阵被普遍的 "虚假 "零计数观测所掩盖。在此,我们开发了scDeepCluster,一种基于单细胞模型的深度嵌入式聚类方法,它通过对scRNA-seq数据生成的明确建模,同时学习特征表示和聚类方法。基于对原创 2022-12-09 10:40:39 · 20 阅读 · 0 评论 -
书籍学习|Unsupervised Feature Extraction Applied to Bioinformatics(part1)
这是一本关于非常经典的数学技术的书:主成分分析和张量分解.原创 2022-10-18 23:56:38 · 311 阅读 · 0 评论 -
书籍学习|Advances in Bioinformatics(part1)
生物信息学是一个迅速发展的生物学领域,并获得了重大的科学和公众关注。它目前被用于生物科学研究的所有领域,并加速了研究工作。它结合了生物学、计算机科学、信息技术、数学和统计学的原理来分析和解释生物数据。原创 2022-10-18 19:30:48 · 333 阅读 · 0 评论 -
书籍学习|Statistical Modelling and Machine Learning Principles for Bioinformatics Techniques(part1)
生物信息学是一个多方面的领域,涉及生物数据的计算方法、技术和软件工具的发展。为了更好地理解和分析生物数据,生物信息学将计算机科学、自然科学和数学领域结合起来。它涉及到生物数据的收集、建模、信息处理分析和可视化,并反过来帮助创建新的算法和工具。原创 2022-10-18 18:56:32 · 281 阅读 · 0 评论 -
单细胞论文记录(part29)--Overcoming Expressional Drop-outs in Lineage Reconstruction from Single-Cell...
单细胞谱系追踪(Single-cell lineage tracing)为了解单个细胞的命运提供了关键性的见解. 单细胞RNA测序(scRNA-seq)普遍应用于现代生物医学研究,但基于遗传学的scRNA-seq数据的系谱追踪仍未被探索. 来自scRNA-seq数据的变体调取存在独特的 "表达缺失",包括基因表达中的低表达和等位基因偏差,这给血统重建带来重大障碍. 我们介绍了SClineager,它通过借用相关细胞的信息来克服表达缺失,从scRNA-seq数据中推断出准确的进化谱系。我们系统原创 2022-10-17 21:38:01 · 240 阅读 · 0 评论 -
生信文献记录(part5)--Application of Sparse Representation in Bioinformatics
受L1-norm最小化方法的启发,如基数追寻、压缩传感和Lasso特征选择,近年来,稀疏表示作为一种新颖而有效的数据处理方法出现,并显示出强大的优越性. 研究人员不仅将信号的稀疏表示扩展到图像表现,而且还将向量的稀疏性应用于矩阵的稀疏性. 此外,稀疏表示还被应用于模式识别,并取得了良好的效果. 由于稀疏表示具有多种优点,如对噪声不敏感、鲁棒性强、对选定的特征不太敏感、没有 "过拟合 "现象等。原创 2022-10-16 17:17:31 · 312 阅读 · 0 评论 -
生信文献记录(part4)--Ensemble deep learning in bioinformatics
Ensemble方法和深度学习模型的显著灵活性和适应性导致了它们在生物信息学研究中的应用激增. 传统上,这两种机器学习技术在生物信息学应用中基本上被当作独立的方法论. 然而,最近出现的Ensemble深度学习–其中两种机器学习技术被结合起来以实现模型准确性、稳定性和可重复性的协同改进–促使了新一轮的研究和应用. 在这里,我们分享了最近ensemble深度学习的主要发展,并看看他们的贡献是如何使从基础序列分析到系统生物学的广泛的生物信息学研究受益.原创 2022-10-15 20:14:15 · 476 阅读 · 0 评论 -
生信文献记录(part3)--Statistical power for cluster analysis
聚类算法在生物医学研究中越来越受欢迎,因为它们具有识别数据中离散子群的能力,而且在主流软件中越来越容易获得。虽然存在算法选择和结果评估的指南,但没有牢固确立的方法来计算聚类分析的先验统计能力。在这里,我们通过模拟来估计常见分析功能的性能和分类精度。我们系统地改变了子组的大小、数量、分离(效应大小)和协方差结构。然后,我们对生成的数据集进行降维处理(无,多维缩放,或统一流形近似和投影)和聚类(K-means,带有Ward或平均联系和欧氏或余弦距离的聚类分级,HDBSCAN)。原创 2022-10-12 22:41:13 · 404 阅读 · 0 评论 -
生信文献记录(part2)--Deep learning-based clustering approaches for bioinformatics
聚类是许多数据驱动的生物信息学研究的核心,是一种强大的计算方法。特别是,聚类有助于分析序列、表达、文本和图像等形式的非结构化和高维数据。此外,聚类被用来深入了解基因组学层面的生物过程,例如,基因表达的聚类可以深入了解数据中固有的自然结构,了解基因功能、细胞过程、细胞亚型和了解基因调节。原创 2022-10-11 17:00:36 · 461 阅读 · 0 评论 -
生信实验记录(part4)
代码记录原创 2022-09-28 17:24:17 · 641 阅读 · 0 评论 -
单细胞论文记录(part28)--GCNG: graph convolutional networks for inferring gene interaction from ST data
大多数从表达数据中推断基因-基因相互作用的方法都集中在细胞内的相互作用. 高通量空间表达数据的出现,为推断细胞内和细胞间的这种相互作用的方法打开了大门. 为了实现这一目标,我们开发了基因图卷积神经网络(GCNG). GCNG将空间信息编码为图,并通过监督训练将其与表达数据相结合. GCNG改进了先前用于分析空间转录组学数据的方法,并能提出新的细胞外相互作用的基因对. GCNG的输出也可用于下游分析,包括功能基因分配.原创 2022-09-28 10:38:36 · 260 阅读 · 0 评论 -
单细胞论文记录(part27)--Method of the Year: spatially resolved transcriptomics
如果一个研究人员正在制作冰沙,这可能是小吃时间. 或者,这可能是为大量RNA测序准备样本的时刻,在这种情况下,组织被均质化并进行分析,以获得来自组织细胞中mRNA的平均基因表达–其转录组.原创 2022-09-19 09:03:31 · 324 阅读 · 0 评论 -
单细胞论文记录(part26)--Spatial components of molecular tissue biology
以空间分辨率的方式分析RNA和蛋白质表达的方法正在迅速发展,使得全面描述健康和疾病中的细胞和组织成为可能. 为了最大限度地利用这些技术获得的生物学见解,关键是要清楚地阐明组织的空间分析中的关键生物学问题,并开发必要的计算工具来解决这些问题. 分析工具的开发者需要决定每个细胞的内在分子特征,以及如何将细胞形状和形态特征纳入分析中. 另外,在不同长度尺度上比较不同组织样本的最佳方法仍在寻求之中.原创 2022-09-17 16:25:43 · 317 阅读 · 0 评论 -
单细胞论文记录(part25)--Cell type-specific inference of differential expression in spatial transcriptomics
空间转录组学的一个核心问题是检测跨组织背景的细胞类型中的差异表达(DE)基因. 学习DE的挑战包括跨空间的细胞类型组成的变化和测量像素检测多种细胞类型的转录物. 在此,我们介绍了一种统计方法,即细胞类型的差异表达推断(C-SIDE),它可以在空间转录组学中识别细胞类型的特定DE,并考虑到其他细胞类型的定位. 我们将基因表达建模为跨细胞类型的对数线性细胞类型特定表达函数的加性混合物. C-SIDE的框架适用于许多情况.原创 2022-09-16 08:56:32 · 405 阅读 · 0 评论 -
单细胞文献学习(part8)--Characterizing spatial gene expression heterogeneity in spatially resolved ...
最近的技术进步使固定组织中数百至数千个基因的表达谱的空间分辨率测量成为可能,而且是单细胞分辨率. 然而,能够考虑到细胞类型固有的三维空间组织和组织内非均匀细胞密度的可扩展计算分析方法仍然缺乏. 为了解决这个问题,我们开发了MERINGUE,这是一个基于空间自相关和交叉相关分析的计算框架,可以识别具有空间异质性表达模式的基因。原创 2022-09-15 22:43:31 · 271 阅读 · 0 评论 -
单细胞论文记录(part24)--Transcriptome-scale spatial gene expression in the human dorsolateral prefrontal...
我们使用10x Genomics Visium平台来定义6层人类背外侧前额叶皮层(DLPFC)中基因表达的空间拓扑. 我们确定了广泛的层级富集的表达特征,并完善了与之前层级标记的关联. 我们将我们的层级表达特征叠加到大规模单核RNA测序数据上,加强了表达驱动的集群的空间注释. 通过整合神经精神疾病基因集,我们显示了与精神分裂症和自闭症谱系障碍相关的基因的差异性层富集表达,突出了空间定义的表达的临床意义.原创 2022-09-08 23:04:31 · 217 阅读 · 0 评论 -
单细胞论文记录(part23)--SC3 - consensus clustering of single-cell RNA-Seq data
单细胞RNA-seq(scRNA-seq)可以根据全局转录组的特征进行定量的细胞类型描述. 我们提出了单细胞共识聚类(SC3),这是一个用户友好的无监督聚类工具,通过协商一致的方法结合多种聚类方案,实现了高精确度和稳健性. 我们证明SC3能够根据从病人身上收集的肿瘤细胞的转录组识别亚克隆.原创 2022-09-08 18:01:24 · 300 阅读 · 0 评论 -
单细胞论文记录(part22)--Giotto: a toolbox for integrative analysis and visualization of spatial expression
空间转录组和蛋白质组技术提供了新的机会来研究细胞在其原生微环境中的情况. 在这里,我们提出了Giotto,一个用于空间数据分析和可视化的全面和开源的工具箱. 该分析模块通过实现广泛的算法来提供端到端的分析,以描述组织构成、空间表达模式和细胞相互作用. 此外,单细胞RNAseq数据可以被整合到空间细胞类型富集分析中. 可视化模块允许用户交互式地将分析结果和成像特征可视化. 为了证明其普遍适用性,我们将Giotto应用于包括不同技术和平台的广泛的数据集.原创 2022-09-06 22:54:24 · 291 阅读 · 0 评论 -
单细胞文献学习(part7)--Visualization and analysis of gene expression in tissue sections by spatial transcri
对组织学切片中蛋白质或信使RNA(mRNA)模式的分析是生物医学研究和诊断学的基石. 我们设计了一种策略,我们称之为 "空间转录组学",它允许在单个组织切片中以空间分辨率对转录组进行可视化和定量分析. 通过将组织学切片置于具有独特positional barcodes的阵列式反转录引物上,我们展示了高质量的RNA测序数据,并保持了小鼠大脑和人类乳腺癌的二维位置信息. 空间转录组学提供了定量的基因表达数据和组织切片内mRNAs分布的可视化,并实现了新型的生物信息学分析,在研究和诊断中很有价值原创 2022-08-23 23:23:50 · 236 阅读 · 0 评论 -
单细胞论文记录(part21)--Demystifying “drop-outs“ in single cell UMI data
数据的分析一直具有挑战性,特别是由于在UMI计数中观察到过多的零点. 一个普遍的观点是,许多检测到的零是在实验过程中发生的 “drop-outs”,这些零应该通过归一化、方差稳定化和推算等程序加以说明. 在这里,我们广泛地分析了公开可用的UMI数据集,并对现有的scRNA-seq工作流程提出了挑战.原创 2022-08-23 19:55:18 · 287 阅读 · 0 评论 -
单细胞论文记录(part20)--A Spatiotemporal Organ-Wide Gene Expression and Cell Atlas of the Developing ...
对人类的心脏形态发生过程的了解还不全面. 它的完整特征需要以单细胞的空间分辨率深入探索整个器官的基因表达协调过程. 在这里,我们提出了一种分子方法,揭示了胚胎心脏在三个发育阶段的细胞类型的全面转录情况,并将细胞类型的特定基因表达映射到特定的解剖学领域. 空间转录组学确定了独特的基因谱,与每个发育阶段的不同解剖区域相对应. 通过单细胞RNA测序确定的人类胚胎心脏细胞类型证实并丰富了胚胎心脏基因表达的空间注释. 然后,原位测序法被用来完善这些结果,并为三个发育阶段创建一个空间亚细胞图.原创 2022-08-23 17:31:28 · 240 阅读 · 0 评论 -
生信实验记录(part3)--scipy.spatial.distance_matrix
学习笔记,仅供参考,有错必纠。原创 2022-08-10 22:13:17 · 529 阅读 · 0 评论 -
生信实验记录(part2)--tf.reduce_sum()用法介绍
作用是按一定方式计算张量中元素之和转载 2022-08-10 19:26:00 · 210 阅读 · 0 评论 -
单细胞文献学习(part6)--ForestFireClustering for sc sequencing combines iterative label propagation with ...
在单细胞测序的时代,越来越需要用聚类方法从数据中提取观点.在这里,我们介绍了ForestFireClustering,一种高效且可解释的方法,用于从单细胞数据中发现细胞类型.森林火灾聚类法使得minimalpriorassumptions,与目前的其他方法不同,它计算出每个细胞被分配到一个细胞类型标签的非参数化后验概率发现稀有细胞类型的有用工具....原创 2022-07-23 11:59:55 · 261 阅读 · 0 评论 -
单细胞论文记录(part19)--A comprehensive comparison on cell-type composition inference for ST data
空间转录组学(ST)技术使研究人员能够在保持位置信息的同时检查转录情况.完整组织样本的这种空间分辨率的转录特征提供了在其自然空间和功能背景下基因表达的综合观点.然而,基于高通量测序的ST技术还不能达到单细胞分辨率.因此,与批量RNA-seq数据类似,ST点级的基因表达数据反映了多个细胞的转录概况,并需要推断每个ST点内的细胞类型组成。...原创 2022-07-22 13:26:10 · 209 阅读 · 0 评论 -
单细胞文献学习(part5)--Using Cell-to-Cell Variability— A New Era in Molecular Biology
每个使用过显微镜的细胞生物学家都知道,群体中的单细胞显示出可变行为(1). 虽然单细胞之间的异质性在组织和生物体中很明显,但在相同条件下培养的单克隆细胞群中也可以观察到异质性. 除了具有随机性的来源(2,3),在原核细胞和哺乳动物细胞中,基因相同的细胞之间的表型变异是确定的和调节的(4,5). 分子和细胞生物学家传统上忽视了这一现象,部分原因是技术上的限制,但也因为历史上研究的重点是细胞间的共同机制和过程....原创 2022-07-20 18:45:22 · 233 阅读 · 0 评论 -
单细胞论文记录(part18)--Spectral clustering based on learning similarity matrix
Motivation单细胞RNA测序(scRNA-seq)技术可以在单细胞水平上产生全基因组表达数据.scRNA-seq分析的一个重要目标是对细胞进行聚类,每个聚类由属于同一细胞类型的细胞组成,基于基因表达模式.Results我们引入了一个新的谱聚类框架,对目标矩阵施加稀疏结构.具体来说,我们利用多个双随机相似性矩阵来学习相似性矩阵,其动机是观察到每个相似性矩阵可以是数据的不同信息表示.我们在目标矩阵上.我们使用ADMM算法迭代地解决所提出的非凸问题。...原创 2022-07-20 16:00:01 · 242 阅读 · 0 评论 -
单细胞论文记录(part17)--Integrating sc transcriptomic data across different conditions, tech and species
计算single-cellRNA-seq(scRNA-seq)方法已成功应用于代表单一条件、技术或物种的实验,以发现和定义细胞表型.然而,识别存在于多个数据集中的细胞亚群仍然具有挑战性.在此,我们介绍了一种分析策略,用于整合基于共同变异源的scRNA-seq数据集,从而能够识别跨数据集的共享群体并进行下游的比较分析.......原创 2022-07-19 22:33:23 · 385 阅读 · 0 评论 -
单细胞论文记录(part16)--A Data-Driven Clustering Recommendation Method for Single-Cell RNA-Sequencing Data
谱聚类在二维连续形状的数据集上往往表现得更好,而层次聚类在二维簇间有明显边界的数据集上取得更好的效果.在这一发现下,我们开发了一种新的策略,称为QRS,用来定量评估数据集的潜在代表形状,以区分它是否有明确的边界.最后,我们提出了一种数据驱动的聚类推荐方法,称为DDCR,用于推荐scRNA-seq数据的分层聚类或谱聚类.我们对两种典型的单细胞聚类方法SC3和RAFSIL进行了DDCR,结果表明DDCR为不同的scRNA-seq数据集推荐了更合适的下游聚类方法,并获得了更稳健和准确的结果....原创 2022-07-17 22:23:57 · 190 阅读 · 0 评论 -
单细胞论文记录(part15)--Integrated analysis of multimodal single-cell data
多种模式的同时测量代表了单细胞基因组学的一个令人兴奋的前沿,并需要有能够基于多模式数据定义细胞状态的计算方法. 在这里,我们介绍了 "weighted-nearest neighbor ",这是一个无监督的框架,用来学习每种数据类型在每个细胞中的相对效用,从而实现对多种模式的综合分析. ...原创 2022-07-16 00:01:02 · 529 阅读 · 0 评论 -
单细胞文献学习(part4)--SCANPY: large-scale single-cell gene expression data analysis
SCANPY是一个用于分析单细胞基因表达数据的可扩展工具包.它包括预处理、可视化、聚类、伪时间和轨迹推断、差异表达测试和模拟基因调控网络的方法.其基于Python的实现有效地处理了超过一百万个细胞的数据集(https//github.com/theislab/Scanpy)....原创 2022-07-15 18:39:55 · 316 阅读 · 0 评论 -
生信实验记录(part1)--为Jupyter指定虚拟环境的Python解释器
上周开始做生信实验,为了不干扰到电脑原来的环境,就整了个虚拟环境(具体虚拟环境的创建流程请见Django从理论到实战(part1)–虚拟环境),配置好实验环境后,不知道怎么在Jupyter Notebook中指定虚拟环境的python解释器,查找资料后(为 Jupyter Notebook指定虚拟环境的 Python 解释器),解决疑问,写下此篇..........原创 2022-07-06 22:18:40 · 569 阅读 · 0 评论 -
生信可视化(part4)--相关性图
相关性图原创 2022-06-20 19:31:36 · 996 阅读 · 1 评论 -
生信可视化(part3)--小提琴图
学习笔记,仅供参考,有错必纠原创 2022-06-19 10:49:34 · 548 阅读 · 0 评论 -
生信可视化(part2)--箱线图
学习笔记,仅供参考,有错必纠排序箱线图主要用于展示在各个组织或器官中,某个基因的表达量.输入数据格式:代码:x轴表示肿瘤类型,y轴表示基因AP1的表达量,不同的肿瘤用不同颜色表示,由此图可以看出基因AP1在哪些组织中是高表达的.差异箱线图用于比较两组之间某基因表达的差异.输入数据格式:代码:x轴表示正常组和肿瘤组,y轴表示SEMA3D的基因表达量. 图上方为两组之间差异的P值,当P小于给定显著性水平α\alphaα时,则表示两组之间差异显著.输入数据格式:代码:x轴表示基因名称,y轴表示基因原创 2022-06-18 09:46:10 · 1426 阅读 · 0 评论 -
生信可视化(part1)--柱状图
学习笔记,仅供参考,有错必纠y轴代表gene的名称,x轴代表gene出现的数目, 通过此图可以看出哪些gene出现次数最多,从而找出核心gene.显著性柱状图,在原本柱状图的基础上增加了柱子颜色(统计学上的显著性),该图一般用于GO结果展示.显著性柱状图的y轴代表GO的名称,x轴代表富集在GO上gene的数目,柱子颜色越红代表gene在GO上富集越显著.x轴代表样品名,y轴代表免疫细胞的含量(百分比).分类柱状图可用于展示GO富集结果. y轴表示GO名称,x轴代表富集在GO上gene的数目,柱子不同原创 2022-06-14 18:54:27 · 525 阅读 · 1 评论 -
单细胞论文记录(part14)--CoSTA: unsupervised convolutional neural network learning for ST analysis
学习笔记,仅供参考,有错必纠Authors:Yang Xu, Rachel Patton McCordJournal:BMC BioinformaticsYear:2021Keywords: Spatial transcriptomics, Gene clustering, Convolutional neural networkBackground: 空间转录组学技术的兴起,使人们对基因调控(gene regulation)如何在空间背景下发生有了新的认识. 确定哪些基因以类似的空间模式表达,可以原创 2022-06-14 16:32:23 · 248 阅读 · 0 评论 -
单细胞论文记录(part13)--SpaGCN: Integrating gene expression, spatial location and histology to ...
学习笔记,仅供参考,有错必纠Authors:Jian Hu,Xiangjie Li,Mingyao LiJournal:Nature MethodsYear:2021Recent advances in spatially resolved transcriptomics (SRT) technologies have enabled comprehensive characterization of gene expression patterns in the context of tissue原创 2022-06-11 11:56:06 · 444 阅读 · 0 评论 -
单细胞论文记录(part12)--Unsupervised Spatial Embedded Deep Representation of Spatial Transcriptomics
学习笔记,仅供参考,有错必纠Authors:Fu Huazhu, XU Hang,Chen JinmiaoYear:2021Key words: spatial transcriptomics; graph convolutional network; gene expression; deep learningSpatial transcriptomics enable us to dissect tissue heterogeneity and map out inter-cellular com原创 2022-06-11 11:38:02 · 320 阅读 · 0 评论