生物信息学
文章平均质量分 93
朝荣
好好学习,天天向上,顺利毕业,平安快乐!
展开
-
【DimPlot】【FeaturePlot】使用小tips
【DimPlot】【FeaturePlot】使用小tips原创 2024-03-10 16:08:29 · 4689 阅读 · 2 评论 -
【FindAllMarkers】Seruat鉴定差异表达基因的方法与P值的理解
为什么用校正后的P值原创 2024-03-10 15:13:12 · 4414 阅读 · 0 评论 -
【OrthoFinder】直系同源基因分析工具
它是一个快速、准确和全面的比较基因组学工具。可以找到直系同源基因群和直系同源基因,为所有直系同源基因群推导出有根的基因树,并确定这些基因树中的所有基因复制事件。它还为被分析的物种推导出有根的物种树,并将基因树上的基因复制事件映射到物种树的分支上,为比较基因组分析提供全面的统计数据。它使用简单,运行它所需要的只是一组FASTA格式的蛋白质序列文件(每个物种一个)它与其他直系同源推断软件不同,OrthoFinder使用基因树。这意味着你可以在它所来自的基因树中检查每个直系同源关系。原创 2024-03-03 19:40:00 · 1026 阅读 · 0 评论 -
【 10X summary report】怎么看?详细解读笔记
在开始正式的分析之前,需要查看在对齐和计数过程中生成的任何总结统计信息。下图是由Cell Ranger工具创建的10X总结报告,在从10X scRNA-seq实验生成计数矩阵时会生成。下图为本人使用CellRanger V5.2.0对语一个单细胞数据跑出的结果。原创 2024-03-03 12:32:45 · 955 阅读 · 0 评论 -
【降维算法UMAP】调参获得更适合的低维图
为什么要降维:单细胞转录组数据往往是数千*数万(细胞数*基因数)的矩阵数据,降维可以帮助可视化和理解大型高维数据集。降维算法:在单细胞转录组生信分析中,常见的降维算法有两种,UMAP和T-SNEUMPA运算速度会更快,并且在保留数据结构的同时提供了更好的扩展性。UMAP的主要步骤学习高维空间中的流形结构找到该流形的低维表示,优化低维图。原创 2024-03-03 12:20:46 · 3629 阅读 · 0 评论 -
【生信】全基因组关联分析(GWAS)原理
【生信】全基因组关联分析(GWAS)1.前提知识介绍1.1 最小二乘法1.2 GWAS的数学原理1.3 Hardy-Weinberg定律&卡方检验1.4 连锁不平衡1.5 曼哈顿图1.6 箱式图Box-plot1.7 QQ plot2、GWAS的定义2.1 几个需要知道的概念:2.2全基因组关联分析3、GWAS——数据预处理3.1质控的原因:3.2基因型数据的质控:3.4表型数据质控:3.5正负链翻转3.6 基因型填补3.7群体分层校原创 2022-03-12 18:53:01 · 53002 阅读 · 10 评论 -
【生信】全基因组测序(WGS)
1、全基因组测序(WGS) 的定义2、GWS流程2.1准备工作——分析软件2.2原始数据质控2.3数据预处理2.4变异检测原创 2022-03-07 21:30:38 · 33594 阅读 · 0 评论 -
【生信MOOC】生物序列比对工具——多序列比对
【生信MOOC】生物序列比对工具2——多序列比对1、多序列比对的定义和用途2、多序列比对的要求3、多序列比对工具——EMBL - Clustal Omega4、多序列比对工具——EMBL - TCOFFEE - Expresso5、多序列比对的保存格式6、多序列比对结果编辑——jalview7、寻找保守区域:序列标识图 WebLogo8、寻找保守区域:序列基序 MEME9、寻找保守区域:PRINTS 指纹图谱数据库原创 2022-03-05 17:16:57 · 17533 阅读 · 5 评论 -
【生信MOOC】生物序列比对工具
1、需了解的背景知识2、替换计分矩阵核酸替换计分矩阵蛋白质替换计分矩阵3、序列比对方法(1)打点法(2)两两序列比对算法4、在线序列比对工具EMBL 全局双序列比对工具Biotools 的双序列比对工具原创 2022-03-04 13:54:28 · 5978 阅读 · 0 评论 -
【生信MOOC】生信数据库2
1、一级蛋白质序列数据库:UniProt 数据库2、一级蛋白质结构数据库:PDB数据库3、二级蛋白质结构数据库:结构域家族数据库Pfam4、二级蛋白质结构数据库:结构分类数据库CATH5、二级蛋白质结构数据库:结构分类数据库SCOP26、专项数据库:京都基因与基因组百科全书KEGG原创 2022-03-03 17:23:51 · 3478 阅读 · 0 评论 -
【生信MOOC】生信数据库1
1、认识生物数据库装载的内容2、生物数据库的分类3、文献数据库——PubMed4、一级核酸数据库——NCBI的Genbank数据库4.1——大肠杆菌dUTPas(脱氧尿苷焦磷酸酶)X01714的DNA序列4.2——编码人dUTPase的成熟mRNA序列U902234.3——编码人dUTPase的dut基因序列。序列AF0184305、一级核酸数据库——基因组数据库Ensemble6、一级核酸数据库——微生物宏基因组数据库JCVI7、二级核酸数据库原创 2022-03-01 20:32:28 · 4446 阅读 · 0 评论 -
【生信】生物序列比对
1、生物序列比对介绍2、序列比对算法基于全局匹配的算法(1)打分矩阵(2)动态规划算法(3)Needleman-Wunsch算法基于局部匹配的算法Smith-Waterman算法Smith-Waterman算法与Needleman-Wunsch算法的区别启发式搜索算法BWT((Burrows–Wheeler_transform))算法3、多序列比对介绍原创 2022-02-09 16:57:33 · 8179 阅读 · 0 评论 -
【生信】常见测序数据格式
【生信】常见测序数据格式1、FASTA2、FASTQ3、GFF4、BED5、SAM/BAM6、VCF原创 2022-02-05 11:34:01 · 8610 阅读 · 0 评论 -
【生信】基因组学中的统计学应用
【生信】基因组学中的统计学应用原创 2022-02-03 21:07:05 · 3247 阅读 · 0 评论 -
【生信】统计学基础知识
【生信】统计学基础知识本文图片来源网络或学术论文,文字部分来源网络与学术论文,仅供学习使用。原创 2022-02-03 20:26:21 · 2643 阅读 · 2 评论 -
【生信】基因组学相关基础知识2
【生信】基因组学相关基础知识2原创 2022-02-03 15:31:50 · 2493 阅读 · 0 评论 -
【生信】基因组学相关基础知识1
【生信】基因组学相关基础知识1原创 2022-02-03 14:40:30 · 3401 阅读 · 0 评论 -
【non-coding RNA】 非编码RNA有哪些?
【non-coding RNA】 非编码RNA有哪些?原创 2022-01-04 16:35:37 · 8112 阅读 · 0 评论 -
基因组学两个理念:生命是序列的;生命是数字的。
基因组学是研究基因组的科学,基因组学两个最主要的理念:生命是序列的!生命是数字的!原创 2021-12-31 12:11:34 · 1080 阅读 · 0 评论 -
【生信】第一二三代测序技术原理的理解
作为生信初学者,对基因测序第一、二、三代测序技术的梳理和了解,详细介绍了几个广泛应用的测序技术原理如sanger测序和illumina测序等,仅供学习使用。原创 2021-12-31 12:01:47 · 14799 阅读 · 2 评论