10's Bioinfo Blog
文章平均质量分 82
维他柠檬茶天下第一
Bioinfo Stu From NJMU.
展开
-
【Bioinfo Blog 015】【shell+R】——转录组数据分析
一、常见二代测序数据分析流程mRNA测序(mRNA-seq)已迅速成为分析疾病状态和生物过程的转录组以及在各种研究设计中分析转录组的首选方法。mRNA-Seq不仅是一种高度灵敏和准确的基因表达定量方法,还可以识别已知和新的转录异构体、基因融合等特征以及等位基因特异性表达,提供编码转录组的完整视图。RNA-Seq可以检测的种类有:mRNA、Small RNA、IncRNA、rRNA、viral RNA transcript等。RNAseq的分析内容包括序列比对、转录本拼装、表达定量、差异分析、融合基因检测原创 2021-01-30 15:53:53 · 2233 阅读 · 1 评论 -
【Bioinfo Blog 013】【R Code 011】——甲基化芯片数据分析(ChAMP包)
目录一、甲基化芯片检测原理二、甲基化芯片数据分析2.1 数据预处理2.2.1 数据整理2.2.2 质控2.2 甲基化分析2.3 CNV分析2.4 差异甲基化位点注释一、甲基化芯片检测原理二、甲基化芯片数据分析2.1 数据预处理2.2.1 数据整理2.2.2 质控2.2 甲基化分析2.3 CNV分析2.4 差异甲基化位点注释...原创 2021-01-07 19:26:42 · 3987 阅读 · 1 评论 -
【Bioinfo Blog 014】【Shell+R】——乱七八糟各种各样的命令记录
目录1. 压缩/解压1.1 .tar1.2 .zip1.3 .gz2. 进程管理2.1 批量kill2.2 查看后台进程3. 文本操作3.1 批量删掉文件名前几个字符1. 压缩/解压1.1 .tar-z : 使用 gzip 来压缩和解压文件-v : --verbose 详细的列出处理的文件-f : --file=ARCHIVE 使用档案文件或设备,这个选项通常是必选的-c : --create 创建一个新的归档(压缩包)-x : 从压缩包中解出文件压缩文件 file1 和目录 dir2原创 2021-01-03 13:49:21 · 277 阅读 · 0 评论 -
【Bioinfo Blog 012】【R Code 010】——生存分析(Kaplan-Meier & Cox)
来看生存分析~原创 2020-12-21 12:22:36 · 1728 阅读 · 0 评论 -
【Bioinfo Blog 011】【R Code 008】——功能富集分析
一、基因集功能富集分析(Gene Set Enrichment Analysis)基因功能富集分析,是指借助各类数据库和分析工具进行统计分析,挖掘在数据库中与我们要研究的生物学问题具有显著相关性的基因功能类别。For example, given a set of genes that are up-regulated under certain conditions, an enrichment analysis will find which Ontology terms are over-rep原创 2020-12-17 10:53:00 · 2988 阅读 · 0 评论 -
【Bioinfo Blog 010】【R Code 009】——ComBat处理GEO数据批次效应
一、Batch Effect1.1 什么是批次效应(batch effect)?批次效应是测量结果中的一部分,它们因为实验条件的不同而具有不同的表现形式,并且与我们研究的变量没有关系。不同平台的数据,同一平台的不同时期的数据,同一个样品不同试剂的数据,以及同一个样品不同时间的数据等等都会产生一种 batch effect。校正批次效应的目的是减少batch之间的差异,从而更好的获取不同生物学状态之间的差异。1.2 数据标准化可以去除批次效应吗?组学大讲堂上给出的答案是:能够减弱,不能从根本上消除原创 2020-12-14 13:32:45 · 7374 阅读 · 7 评论 -
【Bioinfo Blog 007】——Perl与Python的异同整理
Perl 与 Python 的起源和特点Perl 是 Practical Extraction and Report Language 的简称,由 1987 年 Larry Wall 创建,最初的目的是为了在 UNIX 上方便处理报表,经过长期的发展已经成为一种全功能的程序设计语言,其中心思想是:There’s More Than One Way To Do It。Perl具有强大的正则表达式和模式匹配功能以及灵活的数据结构,但存在一些冗余语法,代码的可读性较差。Python 是一种基于面向对象的解析性原创 2020-11-29 14:46:08 · 465 阅读 · 0 评论 -
【Bioinfo Blog 006】【R Code 005】——GEO表达谱数据质控
数据下载及质控GEO数据下载GEOquery包安装注意:需要R 4.0及以上if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager") BiocManager::install("GEOquery").cel数据下载getGEOSuppFiles("GSE65496")## 定位到目标目录后,解压文件untar("GSE46106_RAW.tar")读取.c原创 2020-11-28 10:32:25 · 3411 阅读 · 2 评论 -
【Bioinfo Blog 005】【Python Code 001】——FASTA文件处理
格式说明FASTA格式是一种基于文本用于表示核苷酸序列(或氨基酸序列)的格式。碱基对(或氨基酸)用单个字母来编码,且允许在序列前添加序列名及注释。>gi|46575915|ref|NM_008261.2| Mus musculus hepatic nuclear factor 4, alpha (Hnf4a), mRNAGGGACCTGGGAGGAGGCAGGAGGAGGGCGGGGACGGGGGGGGCTGGGGCTCAGCCCAGGGGCTTGGGTGGFASTA格式以“>”开头原创 2020-11-24 19:51:04 · 411 阅读 · 0 评论 -
【Bioinfo Blog 004】【R Code 004】——缺失值查找与处理合集(未完)
缺失值查找1、NA判断与计数is.na() # 判断缺失值any(is.na(dat)) # 检查是否存在缺失值sum(is.na(dat)) # 计算dat含有的NA个数sum(!is.na(dat $ V1)) # 计算V1列中非NA的个数2、NA定位缺失值处理1、删除所有含NA样本complete.cases() # 可用来识别矩阵或数据框中没有缺失值的行,若每行都包含完整样本,则返回TRUE,若每行有一个或多个NA,则返回FALSEnewdata=dat[compl原创 2020-11-22 15:44:46 · 241 阅读 · 0 评论 -
【Bioinfo Blog 003】【R Code 003】——ForestPlot
Introduction森林图是以统计指标和统计分析方法为基础,用数值运算结果绘制出的图型。它在平面直角坐标系中,以一条垂直的无效线(横坐标刻度为1或0)为中心,用平行于横轴的多条线段描述了每个被纳入研究的效应量和可信区间。分类变量的森林图当某研究RR(OR,RD)的95%CI包含了1,可认为试验组发生率与对照组发生率相等,试验因素无效。当某研究RR(OR,RD)的95%CI上下限均>1,可认为试验组的发生率大于对照组的发生率。2.1 若研究者所研究的事件是不利事件(如发病、患病、死亡等)原创 2020-11-20 10:19:15 · 476 阅读 · 0 评论 -
【Bioinfo Blog 002】【R Code 002】【ggplot2 001】geom_boxplot
Introductionboxplot代码记录最近发现一个超好用的ggplot2辅助工具包:ggThemeAssist用shiny交互式的生成想要的样式,一键输出theme的代码,超级超级好用!放心把ggplot出的图赋值后交给他吧!ggThemeAssistGadget(p6)还有ggsci,我不允许有人不知道它!The Simpsons的调色板莫名好看!!教你用科学杂志喜欢的配色作图——R包ggsciR Codelibrary(ggplot2)library(ggsci)libr原创 2020-11-15 15:27:04 · 223 阅读 · 0 评论 -
【Bioinfo Blog 001】【R Code 001】——TukeyMethodToRemoveOutliers
我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:全新的界面设计 ,将会带来全新的写作体验;在创作中心设置你喜爱的代码高亮样式,Markdown 将代码片显示选择的高亮样式 进行展示;增加了 图片拖拽 功能,你可以将本地的图片直接拖拽到编辑区域直接展示;全新的 KaTeX数学公式 语法;增加了支持甘特图的mermaid语法1 功能;增加了 多屏幕编辑 Markdown文章功能;增加了 焦点写作模式、预览原创 2020-11-15 14:58:11 · 191 阅读 · 0 评论 -
【Bioinfo Blog 000】【Debug Record】
【R Debug History】20200312outlierKD(final_ns$CS.lymph.nodes…2004…,lymph)报错:$ operator is invalid for atomic vectors解决:赋值给对象后在放入函数lymph <- final_ns$CS.lymph.nodes…2004…outlierKD(final_ns,lymph)20200504kk <- paste(“Surv(final_dat$Survival.m原创 2020-11-15 14:36:33 · 328 阅读 · 0 评论