Linux与Shell
文章平均质量分 79
主要分享Linux和Shell基本操作。
沉香GG
@生信;@分子
展开
-
使用TASSEL5进行候选基因关联分析
候选基因关联分析是GWAS分析流程的重要步骤,同时也是确定候选基因有效变异位置的重要途径,本文主要介绍如何使用TASSEL5进行候选基因关联分析。简要介绍如下:TASSEL5是一个用于进行候选基因关联分析的软件工具。候选基因关联分析(Candidate gene association analysis)是一种寻找基因与特定表型关联的方法。该方法通过先验知识或基因功能的研究,选择一组候选基因,并研究这些基因与表型之间的关系。原创 2024-04-06 23:40:09 · 1001 阅读 · 0 评论 -
使用PopLDdecay软件绘制LD衰减图
PopLDdecay是一款用于进行种群遗传学和关联分析的软件。它可以在全基因组水平上进行基因型数据的相关性和衰减分析,帮助研究人员探索种群间的遗传差异和突变选择的模式。PopLDdecay支持多种数据格式的输入,包括VCF、HapMap、PLINK和BEAGLE等格式。它还提供了直观的可视化功能,可以生成遗传距离和衰减图,帮助用户更好地理解和解释结果。此外,PopLDdecay还具有高效的计算能力和并行处理功能,可以加快分析速度,提高效率。原创 2024-03-29 23:55:34 · 1298 阅读 · 1 评论 -
RNAseq分析:Step6(计算表达丰度)
RNA-seq技术是研究基因表达的常用方法之一,其表达丰度计算是RNA-seq数据分析的重要步骤之一。RNA-seq表达丰度计算的基本流程如下:序列比对:将测序数据比对到参考基因组,得到每个基因的计数。转录本重构:使用转录本拼接软件,如Cufflinks或StringTie,将比对后的 Bam/Sam 文件转换为每个转录本的表达值。这里的转录本可能是已知的基因、未知的基因或转录本。表达值的归一化:考虑样本间的技术差异和表达量大小的影响,对表达值进行归一化。原创 2023-08-24 11:16:55 · 1149 阅读 · 0 评论 -
RNA-seq分析:Step5(拼接)
转录本拼接是指将同一个基因产生的不同转录本进行合并,形成一个完整的基因序列。转录本拼接主要应用于RNA-Seq数据分析中,对基因组注释的完善以及发现未知的基因和转录本具有重要意义。在进行转录本拼接时,首先需要将原始的RNA-Seq数据进行清洗和过滤,去除低质量的序列和污染物。接着,利用特定的拼接软件对清洗后的序列进行处理,根据同源性、跨越剪切和外显子连接等特征,将不同的转录本进行合并。常用的拼接软件包括Cufflinks、StringTie和Trinity等。原创 2023-08-23 10:24:08 · 756 阅读 · 0 评论 -
RNA-seq分析:Step4(比对)
预处理之后的fastq文件,可以使用HISAT2软件将reads比对至参考基因组上。HISAT2软件将reads比对至参考基因组上的步骤如下:1. 对参考基因组进行建索引。对参考基因组进行预处理,生成索引文件,包括基因组序列的FM索引和SA索引。2. 将原始的reads进行预处理。包括去除接头序列、去除低质量的碱基,以及进行过滤,得到质量较高的、可靠的reads。3. 利用建立的FM索引和SA索引,将处理后的reads与参考基因组进行比对。首先,通过FM索引,快速找到与reads匹配的可能位置;原创 2023-08-22 22:48:09 · 1051 阅读 · 0 评论 -
RNA-seq分析:Step3(数据预处理)
RNA-seq是一种高通量基因表达分析技术,常用于研究生物体内基因表达的变化。在进行RNA-seq之前,需要进行预处理工作以优化实验结果。预处理包括:1)样本质量控制,包括检验RNA完整性和纯度;2)RNA文库制备,包括选择RNA样本、RNA转录成cDNA、文库构建等;3)测序平台选择,包括Illumina、IonTorrent等;4)数据质量控制,包括去除低质量序列、去除接头序列、过滤低复杂度序列等;5)比对和定量,包括将测序序列映射到参考基因组、计算基因表达量等。预处理的好坏直接影响后续分析结果的可靠性原创 2023-08-21 16:30:18 · 1799 阅读 · 0 评论 -
RNA-seq分析:Step2(数据的下载)
转录组测序原始文件和基因组数据的下载是进行转录组分析的重要步骤,本文中,以拟南芥的RNA-seq数据为例子,进行RNA原始测序数据的下载和基因组文件的下载。原创 2023-08-20 20:20:09 · 2298 阅读 · 0 评论 -
RNA-seq分析:Step1(软件的安装及配置)
好几个月没有跑RNA-seq分析了,为防止遗忘,特整理分析流程于转录组分析专栏。RNA-seq分析是生信分析流程比较入门的操作,常规的分析主要包括差异基因表达分析、GO和KEGG分析和WGCNA分析。一般来说,前两个分析是最为常见的,第三个主要存在于纯转录组分析文章中。本文主要讲述转录组分析的第一步,软件的安装和配置。原创 2023-08-19 20:26:41 · 1679 阅读 · 2 评论 -
Linux环境下Miniconda3的安装和使用
Conda是一款在Linux中安装程序的软件,类似于Windows中的应用商店。在Linux系统中,使用conda可以方便的进行软件的安装和环境配置。具体详见以下链接:Anaconda系列:conda是什么?conda与pip的区别是什么?_zhanghai4155的博客-CSDN博客本文主要讲述如何在Ubuntu系统中安装和使用Conda,以Miniconda3为例。原创 2023-08-17 15:05:21 · 8554 阅读 · 0 评论 -
Windows10下安装VMware16虚拟机
由于本人系统为Windows 10 家庭中文版,无法安装Linux子系统WSL,虽然网上也有强制安装的方法,但为保险起见,还是把之前的VMware虚拟机重新进行安装,并浅浅记录一下安装过程。原创 2023-08-16 18:32:52 · 324 阅读 · 0 评论 -
Linux中查看文件的行数和列数
【代码】Linux中查看文件的行数和列数。原创 2023-06-30 10:09:34 · 1916 阅读 · 0 评论