自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

super_qun的博客

从零开始的生信

  • 博客(14)
  • 资源 (1)
  • 收藏
  • 关注

原创 RNA-seq:转录组数据分析处理(上)

RNA-seq:转录组数据分析处理一、流程概括RNA-seq的原始数据(raw data)的质量评估raw data的过滤和清除不可信数据(clean reads)reads回帖基因组和转录组(alignment)计数(count )基因差异分析(Gene DE)数据的下游分析二、准备工作学习illumina公司测序原理测序得到的fastq文件注释文件和基因组文件的准备...

2019-01-26 17:04:52 54035 4

原创 简单线性回归 理论分析

简单线性回归理论分析文章目录简单线性回归理论分析回归分析概念回归分析理论回归函数求解样本的回归参数经典模型的基本假定R语言下检查数据特性总体方差的无偏估计样本估计参数的概率分布 @ t检验R语言下的总体参数置信区间估计拟合优度检验 @ 方差分析调整 R2R^2R2整体性假定检验还有一件事,要缔结契约吗?回归分析概念回归分析说研究一个被解释变量(因变量)和一个或多个解释变量(自变量)之间的统计技术。回归分析的意义在于通过重复抽样获得的解释变量的一直或设定值来估计或者预测被解释变量的总体均值。与回归分析

2020-09-17 21:32:56 1076

原创 edgeR基因表达差异分析

edgeR基因表达差异分析文章目录edgeR基因表达差异分析官方文档总结读取read数DGEList对象、构建分组过滤,删除低表达基因CPM标度转换手动过滤自动过滤归一化测序深度有效库大小GC含量基因长度MDS图形展示 样本无监督聚类负二项式模型计算生物变异系数计算差异基因广义线性模型(Glm)计算离散度计算DE基因如果没有重复样本?输出结果查看统计参考:一个比较详细的例子:http://www.iwhgao.com/edger%E7%AE%80%E5%8D%95%E4%BD%BF%E7%94%A8

2020-09-17 21:21:53 10345 1

原创 2020转录组RNA-SEQ上游分析

文章目录安装配置conda使用清华源下载sh脚本并安装设置镜像源conda环境创建激活和退出环境conda安装软件质量评估 @ fastQCfastq格式FsatQC软件multiqc综合所有qc结果解读单一碱基占比单碱基测序质量在150bp上的分布情况测序质量的分布图GC含量测定接头adapter统计过滤reads @ trim_galore过滤标准trim_galore比对 @ hisat2参考基因组,gtf文件选择,不同基因组版本差异构建索引hisat的索引策略hisat的比对策略索引的构建hisat

2020-09-05 17:27:42 4067

原创 git深度学习(上)

git深度学习(上)文章目录git深度学习(上)git配置获取帮助 @ ==help==获取git仓库新建初始化仓库 @ ==init==克隆已有仓库 @ ==clone==记录更新文件状态 @ ==status==跟踪新文件 @ ==add==忽略文件文件比对 @ ==diff==提交更新 @ ==commit==移除文件 @ ==rm==移动文件/重命名 @ ==mv==查看提交历史 @ ==log==git log 输出格式git log的输出过滤本教程主要介绍git本地操作,假定你已经理解gi

2020-08-10 16:26:45 500

原创 通过整理TCGA数据,探索某癌症的癌组织和正常组织的差异基因。

试验目的 :获取三阴性乳腺癌的正常组织和癌症组织的基因表达差异情况,比较三阴性乳腺癌中的基因表达变化情况。试验设计 :通过TCGA获取乳腺癌的RNA-seq表达数据,筛选出三阴性乳腺癌的样本,通过比较癌症和正常组织的表达差异。

2019-04-01 16:11:58 37613 19

原创 诺禾致源学习笔记

linux命令linux的权限权限:权限意义分数权制w写4r读2x执行1eg: 7=4+2+1 #代表w+r+x权限帮助文件:man(详细讲解)和–help(使用语法简介)目录操作:ls -r #反序排列...

2019-03-03 22:40:17 2482 1

转载 CSDN官方markdown使用介绍

这里写自定义目录标题Markdown编辑器使用方法新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入Markdo...

2019-02-21 11:16:39 182

原创 2019/2/20_*.bam 与 *.sam文件中的flag的含义和统计结果

*.sam文件的含义和统计结果*.sam文件的flag信息在sam的信息中,有着重要的信息。包括注释信息部分(header section)和比对结果部分(aligment section)。其中注释信息部分以@开头。如图。比对结果:比对结果每行对应一个片段。每列是一个字段。如有片段是如下格式:D80KHJN1:237:C5HMKACXX:5:1101:1634:1982 147 ...

2019-02-21 11:14:45 5728

原创 2019/2/19_生信软件trim_galore和hisat2软件的结果解读

每日工作2019/2/19trim_galore软件的结果解读trim_galore报告:SUMMARISING RUN PARAMETERS==========================Input filename: ENCFF108UVC.fastq.gz #输入文件Trimming mode: paired-end #双端测序结果Trim Galore version...

2019-02-19 09:38:13 3900

原创 基因表达分析-01基础概念

基因表达分析一. 检测方法Q-PCR基因芯片(Microarray)‌高通量表达序列标签(EST)基因表达系列载体(SAGE)转录组测序(RNA-seq)‌高通量二. 基因表达数据分析分析内容哪些基因表达存在差异差异基因有什么共同功能,参与何种共同代谢不同条件下,哪些基因变化一致受到哪些基因调节(上游)控制哪些基因表达(下游)哪些表达是状态特异的分析方法按...

2019-01-12 15:01:05 1276

原创 利用UCSC Xena做TCGA数据库的生存曲线分析

利用UCSC Xena做TCGA数据库的生存曲线分析UCSC的分析入口打开UCSC Xena网站:UCSC Xena。(网页速度可能不太稳定)点击界面的GET STARTED,在打开的界面右上角点Launch Xena Browser,界面如图,进入分析界面。利用UCSC分析TCGA数据库中乳腺癌样品在serch a study中选择TCGA Breast Cancer (BRCA)...

2019-01-11 14:37:03 13353 2

原创 基因在癌组织中表达水平的生存性分析

基因表达的生存性分析

2019-01-11 14:09:03 5901 1

原创 TCGA数据库的基因表达情况分析

TCGA数据库的基因表达情况分析数据内容TGGA、GTEX数据库下载的数据内容形式如下:A:样品B:表达水平C:样品类型(正常组织和癌组织)D:数据源乳腺癌的基因表达情况以乳腺癌为例:筛选出ATGC的乳腺癌表达情况在PISM软件中新建柱形图图表列标题设置为primary(癌组织)和normal(正常组)分别复制两组的表达水平生成图表,进行T检验表格休整20...

2019-01-11 10:04:28 17658 3

Bioconductor分析基因芯片数据简介

Bioconductor分析基因芯片数据。介绍有基因芯片的基础知识、基因芯片的质量控制、基因芯片的校正、标准化、汇总、基因芯片的数据分析等

2019-01-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除