- 博客(28)
- 收藏
- 关注
原创 trimmomatic质控参数学习笔记——version1.0
只要碱基的质量值低于阈值,则切除该碱基,并调查下一个碱基(因为Trimmomatic从3'prime end开始,将是位于刚切除碱基之前的碱基)。通过为该参数指定true,反向读取也将被保留,这可能是有用的,例如,如果下游工具无法处理成对和非成对reads的组合。但是,由于回文模式的假阳性率非常低,因此可以安全地减少,甚至减少到1,以允许删除较短的接头片段;b) strictness: 这个值应该设置在0和1之间,它制定了保持尽可能多的读取长度与删除不正确的碱基之间的平衡。从起始端开始去除低质量的碱基。
2025-10-24 13:39:14
419
原创 指定列交集内容合并-Rscript_v1.0
有的小伙伴有两张表格(本次只用xlsx格式的),然后想根据两张表格中指定列,比如基因名之类的,然后把两张表中共有基因的信息合并在一起,方便查看,避免两张表中间反复横跳,但奈何不知道怎么弄,最终只能是手动硬肝。比如两张表:然后需要交集基因的信息合并:下面给小伙伴一个R小脚本,自己电脑安装一个R和一个Rstudio软件(都是免费的,别被某些教程给骗了,直接去官网下载正版,是免费开源软件,科研友好),然后把脚本复制过去就能用。
2025-10-24 13:17:49
880
原创 学习 笔记系列--病毒封装_v1.0
收上清2(72 h)→ 合并 → 超速离心 24 000 rpm 2 h 4 ℃ → 重悬100 µL PBS/0.1 % BSA → -80 ℃分装。扩增:6孔板HEK293(80 %)+ 1 mL种子病毒 + 8 µg/mL Polybrene + pCAG-VSV-G 转染(1 µg/孔)最终假病毒:感染HEK293(已转染pCAG-Target-E,表达外源膜蛋白)→ 24 h后收上清 → 0.22 µm过滤 → 分装-80 ℃。4.4 无菌、内毒素 ≤0.25 EU/mL(临床静脉)。
2025-10-13 17:22:00
839
原创 R脚本--PCA分析系列1_v1.0
PCA分析R包有很多,不同的包作图时,如果不注意某些参数设置就会出现:画出图不一致情况。今天主要基于prcomp函数进行主成分分析,然后分别用ggbiplot包和ggplot2包进行可视化。注:如果要展示置信圈,要求每组组内样本数≥4;如果每组组内样本数=3,是画不了置信圈的,只能是画分组椭圆(一般也没必要,意义不大);如果每组组内样本数<3,尽量不要自找麻烦弄PCA了。
2025-10-06 11:51:48
1028
原创 R脚本——LefSE分析与可视化-v1
看谁在哪个组“特别多”,LDA值越大、颜色越纯,越可能是该组的标志菌。LEfSe 是一种完整的差异分析流程,LDA 是这个流程中的最后一步。🔍 分析详细解释:1.LEfSe 是一种用于发现组间显著差异特征(如微生物物种、功能基因等)的分析方法,常用于宏基因组、16S rRNA 等微生物组数据。它整合了统计检验和效应量评估,强调统计显著性与生物学一致性。Kruskal-Wallis 秩和检验:筛选在不同组间丰度差异显著的物种;Wilcoxon 秩和检验(如有亚组):检验这些差异是否在各亚组间一致;
2025-10-05 22:42:28
1122
原创 R脚本--表达矩阵与特征矩阵相关性分析
本脚本改一下对应的两个矩阵,换成你自己的就可以用了,示例数据在附件中,格式为第一列为基因,其余列为样本对应的数据;另一个 矩阵第一列为指标,其余列为第一个矩阵对应样本的指标。注:两个矩阵样本必须一致。做了转录组或者其他组学,有对应样本的多个特征数据,然后做相关性分析并绘制热图。注:不适用于线性回归分析,后续会更新线性回归分析、WGCNA等更进一层次的脚本。
2025-10-05 21:46:17
239
原创 学习笔记系列--常见小鼠品种简介
学习笔记系列—开始前先了解两个概念:封闭群: 非近交交配方式进行交配生产的一个实验动物种群,在不从其外部引入新个体的条件下,至少连续繁殖4代以上,称为一个封闭群;杂合率高,群体基因频率基本稳定,个体存在差异性。 如KM小鼠、ICR小鼠、NIH小鼠、SD大鼠、Wistar大鼠等均是不同的品种。近交系: 至少经20代的同窝交配培育而成,同品系内所有个体都可追溯到起源于第20代或以后代数的一对共同祖先;基因纯合,同基因型,表型均一,遗传稳定,背景资料完整。 如C57
2025-10-04 23:12:02
1121
原创 R脚本——富集分析结果可视化系列--GO+KEGG+基因条形图
有小伙伴可能在生信大佬公众号或者别人文章里面,看到别人对GO和KEGG富集分析结果进行下图的展示(小卡拉自己画的,意思意思,就那个意思就行了):可以看到:GO+KEGG以及每条trem/pathway中富集的基因都尽可能多的做了展示,而且配色和图观感也很不错。相信小伙伴也发现了略有不足的地方:基因没有展示完整。这也是这个图弊端,只能展示部分基因。建议:只展示小伙伴关注的那些通路以及通路中核心基因,然后其他的通路去掉,非关注核心基因用et.al之类的代替就行。
2025-10-03 22:06:38
563
原创 增强子/超级增强子分析结果--表格简单解析
今天先更新一点ROSE分析软件进行超级增强子分析,输出分析结果表格的含义介绍,其余内容后续小伙伴有感兴趣的再补充。下面把ROSE流程输出的6份文件一次性讲透。先给出“一句话结论”,再逐行拆解文件格式、每列含义、常见数字/符号的来历。enhancer区域↔基因(2个文件)(SE)区域↔基因(2个文件)只给区域、不给基因对应关系的“裸坐标”文件(2个文件)一、普通enhancer相关2个文件1.1。
2025-10-03 00:00:21
382
原创 表观调控数据库汇总-v1.0
本文整理了35个表观遗传学相关数据库资源,涵盖RNA修饰、DNA甲基化、组蛋白修饰等多个研究方向。主要包括:1)RNA修饰数据库(如RMBase、RMVar、m6A-Atlas等),用于查询RNA甲基化位点及相关变异;2)DNA甲基化数据库(如EWASDataHub、MethBank、DiseaseMeth等),整合甲基化谱与疾病关联信息;3)组蛋白修饰数据库(如HIstome、HHMD、CHHM等),提供组蛋白修饰位点及功能注释。这些数据库支持多组学数据查询、可视化分析和功能预测。
2025-10-02 18:16:44
920
原创 IGV软件系列--peak可视化
是一款强大的基因组数据可视化工具,广泛应用于ChIP-seq、ATAC-seq、MeRIP-seq、WGBS、RNA-seq等高通量测序数据的结合/开发/修饰/特征表达区域可视化。通过IGV,可以直观地展示目标基因区域的转录因子结合、组蛋白修饰或染色质开放性等信号的分布。转录组之所以用IGV进行指定基因可视化,目的在于找到组间表达趋势差异最大的区域用于设计RT-qPCR引物,尽可能保证验证趋势与测序结果一致。为啥转录组需要这样干。
2025-10-02 18:00:20
2185
原创 学习笔记系列--cGAS-STING信号通路基础知
cGAS-STING信号通路以经典或非经典的信号转导方式控制或调控多种细胞生物学过程,包括自噬(autophagy)、蛋白质合成(protein synthesis)、糖脂代谢(lipid and glucose metabolism)、无膜细胞器(membrane-less organelle)、DNA损伤修复(DNA damage repair)、细胞衰老(cellular senescence)以及多种类型的细胞死亡(cell death)等。图 1-1 cGAS-STING信号通路简图。
2025-10-02 10:49:38
1234
原创 ChIP/MeRIP-qPCR实验与结果分析
本文详细介绍了ChIP-qPCR和MeRIP-qPCR的实验流程及结果计算方法。两种实验均采用%Input法计算,需保持样品比例(IP:IgG:Input=10:10:1)和cDNA稀释比例一致。ChIP实验包括细胞裂解、超声打断、抗体富集、解交联和DNA回收等步骤;MeRIP实验则涉及RNA提取、mRNA分离、抗体富集和反转录。qPCR反应体系为20μL,采用SYBR Green法检测,通过Ct值计算富集百分比。
2025-09-23 13:46:23
1678
原创 组学原始数据上传数据库-GSA
本文详细介绍了将数据上传至GSA数据库的全流程指南。首先需通过官网注册账号并完成验证,随后登录平台建立数据文件夹和项目信息(包括提交者信息、项目描述等)。重点讲解了使用FileZilla软件上传原始测序数据的步骤:从软件下载安装到填写FTP登录信息,再到数据上传和最终提交审核。特别提醒注册后需立即验证邮箱,并建议使用FileZilla进行上传操作。所有步骤完成后需等待官方邮件反馈审核结果,通过后将获得可用于期刊发表的数据编号。整个流程涵盖账号注册、信息填报和数据上传等关键环节。
2025-08-19 23:00:11
2403
原创 R脚本——单个motif可视化-ggseqlogo包
motif矩阵,一般可经过MEME/MEME-CHIO/HOMER等软件分析后,都会有一个后缀为“.motif”或者“.txt”的文件。
2025-01-22 11:01:11
438
原创 R语言-基因表达箱图样式2
"F:/boxplot/output"是保存图片位置和图片名字,图自动给png和pdf;"F:/boxplot/boxplot.xlsx" 是用来画图的数据路径和文件名;好啦,到此结束,有问题评论区见!
2025-01-15 23:50:41
497
原创 HTML文件图片转base64
将图片丢进去,然后转成base64格式,直接用base64码即可,这样就不用单独存储图片了。在线图片转base64,在线base64转图片,图片base64编码-在线工具箱。
2025-01-03 10:06:41
352
原创 CHIP-qPCR引物设计
CHIP-qPCR(染色质免疫共沉淀结合定量聚合酶链反应)是一种用于研究蛋白质与DNA相互作用的技术。:CHIP-qPCR可以用来检测特定蛋白质(如转录因子或组蛋白修饰)在基因组中的特定位点的结合情况。:在完成ChIP-seq分析后,研究人员通常会找到感兴趣的转录因子或组蛋白修饰的靶基因,CHIP-qPCR可以用来进一步证实这些结合状态。:与全基因组测序方法相比,CHIP-qPCR更便宜、更省时,可以对多种样品中的特定基因组区域进行快速和定量比较。
2024-12-31 12:08:56
5076
原创 R-基因-富集圈图/和弦图
看到别人文章里面的GO和KEGG富集分析结果,画的一张图有通路有基因,于是,懒惰的本小卡拉弄了一个R脚本,满足自己的小好胜心!
2024-12-30 13:34:25
1290
原创 R-基因表达箱线图样式1
整理基因表达格式如下: 数据随便自定义的,图丑(见下图),更具需要自行调代码参数即可:需要指定字体的话,使用下面的代码:仅供相互交流学习使用,未经允许,禁止转载,谢谢!
2024-12-30 13:06:43
381
原创 MEME-CHIP使用与结果分析
CHIP-seq、ATAC-seq与cut&tag-seq等作为研究DNA-蛋白互作、染色体开放可及性的重要技术,其主要目的是检测组蛋白结合/转录组因子结合/染色质开放区的具体区域。MEME-CHIP是一种专门设计用于分析CHIP-seq实验中“峰值区域”(即围绕已声明的ChIP-seq“峰值”的短基因组区域)的网络服务。它在研究DNA-蛋白互作区域motif鉴定和染色体开放可及性区域motif可能发生结合的组蛋白/转录因子挖掘等方面发挥着重要作用。
2024-12-28 14:40:29
2620
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅