自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(236)
  • 收藏
  • 关注

原创 single cell&sc atac 让样本名、细胞类型和分组更清晰,方便后续画图和统计。

本文介绍如何为整合后的Seurat对象coembed统一数据标签,包括:1)将RNA和ATAC样本名合并到sample列;2)整合已知和预测的细胞类型到all_celltype列;3)将8个样本分组简化为4个大组(CD_RNA、CK_RNA、CD_ATAC、CK_ATAC)。这些操作旨在标准化元数据,便于后续可视化和统计分析。代码通过条件判断和重新赋值实现了数据的统一归类。

2025-08-11 15:11:46 179

原创 linxu去除参数扩展% vs basename

使用 Bash 参数扩展去掉文件扩展名,性能更好。:使用外部命令basename去掉文件扩展名,更直观但稍慢。你可以根据自己的需求选择使用哪种方法。如果你更喜欢简洁和高效的代码,是一个非常好的选择。希望这个解释清楚地回答了你的问题!如果有其他疑问,请随时告诉我。

2025-08-11 11:50:55 242

原创 screen

掌握screen可以显著提升服务器工作效率,尤其适合需要稳定执行长时间任务的场景。通过会话持久化、多任务管理和协作共享等功能,screen能够帮助你更高效地管理终端会话。希望这些内容对你有所帮助!

2025-08-10 14:48:04 269

原创 `monocle`包中`detectGenes

设置全局表达检测阈值。计算每个基因在多少个细胞中表达。计算每个细胞中有多少个基因表达。更新对象,使其包含这些新的表达检测信息。这些信息对于后续的单细胞数据分析(如差异基因分析、细胞轨迹分析等)非常关键。

2025-08-10 10:43:47 227

原创 Monocle的`orderCells()`

2-a) 先跑一次自动版,看看有哪些 State。2-b) 把 State 1 设为起点再跑一次。下面按“完整流程 + 常见坑”一步步带你用。是 Monocle(v2)里。

2025-08-08 14:32:11 151

原创 Monocle的plot_cell_trajectory()

里把降维结果 + 最小生成树(MST)一起画出来的函数,用来展示细胞“拟时间”或分化轨迹。就能快速看到细胞分化轨迹;其余参数按需微调即可。给一份“即拷即用”的教程。

2025-08-08 14:27:54 135

原创 Seurat的FetchData()函数

是 Seurat 的“瑞士军刀”——任何表达量、降维坐标、元数据,一句话就能拎出来做分析或画图。

2025-08-04 11:19:35 228

原创 sc-atac的基础知识(0)

Arrow 文件存储了单细胞 ATAC-seq 数据的原始信息,包括元数据和序列衍生数据,文件体积较大,存储在磁盘上。ArchRProject 对象是一个内存中的对象,包含了 Arrow 文件的索引和一些高级分析数据,文件体积较小,便于在内存中快速访问和处理。通过使用 ArchRProject 对象,可以高效地访问和管理磁盘上的 Arrow 文件,同时利用内存中的对象进行快速分析。

2025-08-02 18:40:18 576

原创 去重、top_n()、pull()、格式化

是指将变量或数据插入到字符串中,以生成更复杂的文本输出。格式化字符串是处理文本数据时非常重要的工具,可以帮助你生成动态和可读性强的文本输出。是 R 中的基本字符串连接函数,可以将多个字符串连接成一个字符串,并可以指定分隔符。包中的一个函数,用于格式化字符串,类似于 Python 的 f-string。是 R 的内置函数,用于格式化字符串。包中的一个函数,用于按某个列的值排序并提取前 n 行。包中的一个函数,用于从数据框中提取某一列的值为向量。包中的一个函数,用于连接字符串,功能类似于。:动态生成日志消息。

2025-07-31 23:31:31 383

原创 未完待续|植物结构

它是一个植物学名词,主要指植物根的维管柱外围的一层细胞,具有潜在的分裂能力,可参与侧根的形成等过程。指植物根或茎初生构造中,皮层最内侧一圈紧密排列的细胞层,其细胞壁常发生凯氏带(Casparian strip)加厚,控制水分和溶质进入维管束。负责将叶片光合作用产生的有机养分(主要是蔗糖)从源(叶)向库(根、果实、芽等)运输的维管组织,由筛管分子、伴胞、韧皮纤维和薄壁细胞组成。指植物胚胎或幼苗中最早出现的维管束前体分生组织,可进一步分化为初生木质部和初生韧皮部,是根、茎中维管组织的发源地。

2025-07-29 15:49:48 213

原创 水稻调控组全景的综合绘制与建模揭示了复杂性状背后的调控架构

解析调控复杂性状的分子机制是推动作物改良的关键。本研究构建了水稻(Oryza sativa)迄今最全面的调控组图谱,系统描绘了3个代表性品种23种不同组织的染色质可及性景观。我们鉴定出117,176个独特的开放染色质区域(OCRs),占水稻基因组的约15%,该比例显著高于以往植物领域的报道。通过整合配对组织的RNA-seq数据,我们高置信度预测了59,075个OCR-基因调控关联,其中69.54%由增强子介导,并涵盖多个已知的增强子-基因互作案例。

2025-07-27 22:02:29 933

原创 R中匹配函数

grepl是 R 语言中的一个基础函数,而不是tidyverse的函数。它用于检查字符串是否匹配某个模式(正则表达式)。虽然grepl不是tidyverse的一部分,但你可以在tidyverse的工作流程中使用它。grepl。

2025-07-24 11:26:30 446

原创 awk 学习笔记

是一个功能强大的文本处理工具,适用于处理结构化的文本数据。通过掌握基本命令、常用函数和实用脚本,你可以高效地处理和分析数据。希望这些学习笔记对你有所帮助!的知识,包括常用的命令、函数和一些实用的脚本示例。这些内容可以作为学习笔记,帮助你更好地理解和使用。脚本保存为文件,方便重复使用。好的,我将为你总结关于。:确保字段分隔符正确。

2025-07-24 10:59:36 403

原创 tidyverse中的数据合并

在数据处理中,横向合并(也称为宽合并)和纵向合并(也称为长合并)是两种基本的数据合并方式。

2025-07-23 09:39:38 913

原创 `tidyverse` 去除缺失值

在使用tidyverse包处理数据时,去除缺失值(通常表示为NA)是一个常见的操作。tidyverse包提供了一些函数来帮助处理缺失值,例如drop_na()函数,它可以从数据集中删除包含缺失值的行或列。以下是如何使用drop_na()drop_na()dfNAdrop_na()NA。

2025-07-23 09:29:02 217

原创 tidyverse-数据可视化 - 图形的分层语法

通过这些示例和练习,你应该能够理解ggplot2的基本概念,并能够创建各种类型的图形。如果你有任何问题,随时问我!

2025-07-20 23:47:19 693

原创 tidyverse-数据读入

使用read_csv()导入 CSV 文件,可以通过col_types参数显式指定列类型。处理数据导入过程中可能遇到的问题,例如列类型猜测错误和缺失值处理。使用和将数据写入文件以供后续使用。使用tibble()和tribble()手动创建数据框。通过这些工具,你可以高效地导入、处理和保存数据,为数据分析做好准备。

2025-07-20 21:58:29 898

原创 `tidyverse` 长表、宽表的处理

names_to:指定列名对应的变量名,可以使用.value提取变量名。:使用正则表达式匹配列名的结构,提取多个变量信息。names_sep:如果列名是用固定分隔符分隔的,可以使用names_sep参数。通过这些参数,你可以灵活地处理复杂的列名,将宽数据转换为长数据,从而更好地进行数据分析和可视化。整洁数据的重要性:整洁数据格式便于使用tidyverse工具进行分析。数据整理工具:将宽数据转换为长数据。:将长数据转换为宽数据。数据整理的灵活性。

2025-07-20 20:36:40 922

原创 `tidyverse` 中涉及的函数及其用法

函数用于去除重复行,可指定列名以查找特定列的唯一组合。包的核心工具,可以帮助你高效地进行数据转换和操作。函数用于按名称、范围或条件选择数据框中的列。函数用于按一个或多个列的值对数据框进行排序。函数用于基于现有列创建新列,支持数学计算。函数用于按一个或多个变量将数据集划分为组。函数用于根据逻辑条件保留数据框中的行。函数用于保留所有列,仅重命名指定列。函数用于对分组数据进行汇总计算。函数用于从每个组中提取特定行。函数用于移动列的位置。

2025-07-20 20:20:58 942

原创 9 种常用参数检验

────────────────────────────────────2. 数学模型与公式给定 n 个观测值 x₁,…,xₙ,欲检验H₀:μ = μ₀(μ₀ 为已知常数)H₁:μ ≠ μ₀(或单侧)样本均值  xˉ=(1/n)Σixi\bar{x} = (1/n) Σᵢ xᵢxˉ=(1/n)Σi​xi​样本方差  s2=Σi(xi−xˉ)2/(n−1)s² = Σᵢ (xᵢ - \bar{x})² / (n-1)s2=Σi​(xi​−xˉ)2/(n−1)检验统计量  t = ( xˉ−μ0)/

2025-07-13 16:41:35 420

原创 文献学习|全面绘制和建模水稻调控组景观揭示了复杂性状背后的调控架构。

解析调控复杂性状的机制对于推进作物改良至关重要。在此,我们提出了一个全面的水稻(Oryza sativa)调控组图谱,涵盖了来自三个代表性品种的23种不同组织的染色质可及性。我们的研究揭示了117,176个独特的开放染色质区域(OCRs),占水稻基因组的约15%,这一比例显著高于之前在植物中的报告。通过整合匹配组织的RNA-seq数据,我们自信地预测了59,075个OCR到基因的联系,其中增强子构成了这些关联的69.54%,包括许多已知的增强子到基因的联系。

2025-07-08 23:08:09 602

原创 wilcoxauc()替代findallmarker()

包中的一个工具,用于快速计算 Wilcoxon 秩和检验和曲线下面积(auROC)。这个函数特别适用于单细胞 RNA 测序数据,可以处理多种输入格式,包括密集矩阵、稀疏矩阵、Seurat 对象和 SingleCellExperiment 对象。函数是一个强大的工具,适用于单细胞 RNA 测序数据的差异表达分析。通过支持多种输入格式,您可以轻松地将其应用于不同的数据类型。希望上述指南能帮助您正确使用该函数。如果您有其他问题或需要进一步的帮助,请随时告诉我!如果您的数据是稀疏矩阵(如。首先,确保您已经安装了。

2025-07-08 13:21:01 667

原创 单细胞数据格式转换:rds 与 h5ad互转

将 RDS 格式的单细胞数据转换为 H5AD 格式。将 H5AD 格式的单细胞数据转换为 RDS 格式。

2025-07-07 16:46:41 273

原创 植物发育、适应和进化中的顺式调控元件

顺式调控元件(cis-Regulatory elements)是基因组蓝图的编码者,它们确保了基因表达在时间和空间上的适当模式,这对于正常的发育以及对环境的响应是必需的。越来越多的证据表明,基因表达的变化是真核生物表型创新的主要来源,包括哺乳动物中的急性表型,如疾病和癌症。此外,影响顺式调控序列的遗传和表观遗传变异在更长的进化时间尺度上已成为形态分歧和本地适应研究中的一个反复出现的主题。在这里,我们讨论了识别各种顺式调控元件类别及其在植物发育和环境响应中的作用的功能和方法。

2025-07-03 09:19:02 783

原创 DNBC4tools使用

这是华大基因开发的用于分析高通量。单细胞测序数据的开源分析流程工具。

2025-07-01 18:05:16 915

原创 《玉米中细胞类型特异性顺式调控的遗传结构》

基因表达和复杂的表型是由顺式调控元件的活性决定的。然而,目前对于现存的遗传变异如何影响顺式调控的理解仍然有限。在这里,我们利用单细胞基因组学研究了超过70万个玉米(Zea mays)自交系的细胞核,以探究顺式调控多样性的后果。我们的分析确定了独特的顺式调控元件,这些元件是驯化玉米所特有的,并揭示了历史上的转座子活动是如何塑造顺式调控格局的。利用群体遗传学原理,我们精细定位了约22,000个与染色质可及性相关的遗传变异,这些变异具有广泛的细胞类型特异性效应。

2025-07-01 15:30:33 789

原创 安装 COSGR 包的学习笔记

如果加载成功,说明 COSGR 包已经正确安装。你可以尝试运行一些示例代码来验证功能是否正常。后,R 会提示你输入用户名和令牌。输入你的 GitHub 用户名和之前生成的令牌。git在~/miniconda3/envs/seruat/bin/git。,可以通过设置环境变量来指定 R 使用的。如果你使用的是 Miniconda 环境,安装完成后,可以通过以下命令查找。在终端中运行以下命令查询系统中。,可以通过以下命令查找所有。在终端中运行以下命令查询。如果系统中安装了多个。

2025-06-16 16:42:57 369

原创 单细胞相关教程

2025-06-11 15:02:36 114

原创 【无标题】

2.单细胞常用数据库介绍及使用: 是美国国立生物技术信息中心(NCBI)维护的公共基因表达数据库,网址为。GEO数据库包含高通量基因表达数据,支持从单个细胞到组织水平的基因表达分析。: 是由加州大学圣克鲁兹分校提供的数据库,网址为。它提供了多种细胞类型的基因表达数据,支持对单细胞RNA测序数据的查询和分析。: 是一个旨在建立人体所有细胞类型的参考图谱的项目,网址为。HCA数据库包含大量的单细胞RNA测序数据,有助于理解细胞的多样性和功能。: 由国家基因库生命大数据平台(CNGBdb)提供,网址为。

2025-06-09 21:18:36 209

原创 SCFSlRAE1通过调节SlWRKY1的稳定性来调控番茄对灰霉菌的抗性。

泛素化是一种关键的翻译后修饰,在植物免疫反应的精细调控中发挥着核心作用。番茄(Solanum lycopersicum)因灰霉菌(Botrytis cinerea)这种毁灭性病原体的侵害而遭受严重的产量和品质损失。我们发现SlRAE1基因(编码一种E3泛素连接酶)是番茄抗灰霉菌的关键负向调控因子。SlRAE1与SlSKP1(SKP1–Cullin1–F-box [SCF]复合体的一个组分)相互作用,通过26S蛋白酶体途径调节转录因子SlWRKY1的蛋白稳定性。SlWRKY1靶向并抑制茉莉酸(JA)信号传导的

2025-06-08 13:24:43 648

原创 molgenis/systemsgenetics

希望这些笔记能够帮助您更好地理解和使用。

2025-06-08 10:31:33 873

原创 基于 GWAS 的群体遗传分析将 bZIP29 确定为玉米中的异种基因

了解异质基因在杂种优势形成中的作用对于推进杂交育种至关重要。我们分析了玉米杂交种群体的株高(PH)、穗高(EH)和转录组数据。全基因组关联研究(GWAS)表明,数量性状位点(QTL)的显性效应在杂交性状和中亲优势中起着重要作用。通过整合GWAS、表达GWAS(eGWAS)和模块eGWAS分析,我们优先确定了六个候选异质基因,这些基因位于六个QTL之下,其中包括一个跨越bZIP29基因的QTL。在杂交种群体中,bZIP29表现出对杂交性状和中亲优势的加性表达和显性效应,其有利等位基因与PH和EH呈正相关。

2025-06-07 21:19:29 1158

原创 indel_snp_ssr_primer

脚本头部信息和模块加载。命令行参数的解析。提供帮助信息。为未指定的参数设置默认值。初始化全局变量,用于存储参考基因组序列及其长度。读取参考基因组文件,并将其存储到哈希表中。处理 VCF 文件路径,确保文件可以正确读取。初始化相关变量,用于存储 SSR 和基因型信息。逐行读取 VCF 文件,提取 indel 信息,并获取 indel 两侧的侧翼序列。检测 SSR,并生成 Primer3 的输入文件。将 Primer3 输入文件分批保存,生成对应的 Shell 命令行。

2025-05-28 21:06:19 1216

原创 分子生物学:内含子、外显子、ORF、CDS、可变剪切

2025-05-26 09:29:56 240

原创 文章代码|皮层/表皮特异性转录因子 bZIP89 的自然变异决定了玉米侧根发育和抗旱能力

本研究中的大量 RNA-seq 读数存放在 NCBI 序列读取档案 (www.ncbi.nlm.nih.gov/sra) 中,登录代码为 SRP446501/PRJNA980895。scRNA-seq、DAP-seq 和 DNA 测序源数据存放在基因组序列档案 (https://bigd.big.ac.cn/gsa) 中,登录号为 CRA018050、CRA018051 和 CRA017878。本文中使用的代码可在 https://doi.org/10.5061/dryad.nzs7h451h 处访问。

2025-05-25 14:21:55 189

原创 MADS-box编码基因Tunicate1通过增加玉米果穗上方的叶片数量正向调控玉米产量。

玉米果穗上方的叶片是玉米籽粒灌浆的主要碳水化合物来源。然而,在现代玉米育种中,通过增加果穗上方叶片数量来增强碳源并提高玉米产量仍然是一个挑战。在此,我们克隆了与果穗上方叶片数量相关的数量性状位点(QTL)的致因基因。该致因基因是之前报道的MADS-box结构域编码基因Tunicate1(Tu1),它负责有稃玉米或Tunicate玉米的表型。我们发现,Tu1可以在保持源—库平衡的同时显著增加果穗上方的叶片数量。

2025-05-25 13:28:50 1016

原创 文献学习|DBB2 调节玉米株高和避阴反应

在模式植物拟南芥(Arabidopsis thaliana)中,多种光受体,如光敏色素(phyA、phyB)、隐花色素(CRY1)和UVR8,已被鉴定为与SAR相关的各种细胞过程的关键参与者(Keller等,2011;Burko等,2022)、B盒蛋白(BBX21、BBX22、BBX24)(Crocco等,2010,2015)以及同源框蛋白(HB、HB2、HB4)(Sorin等,2009),都参与了SAR的调控。Xu等,2023)。作物的株高受到茎秆中节间数量和长度的共同影响(Le等,2022)。

2025-05-20 08:57:24 1098

原创 玉米籽粒发育

这段文字强调了BETL在玉米籽粒发育中的关键作用,以及ZmMRP1、ZmMn1、ZmSWEET4c和ENB1等基因在BETL细胞形态建成和功能中的重要性。这些基因的表达和功能对于BETL细胞的分化、细胞壁形成、糖分运输等过程至关重要,影响籽粒的灌浆和最终的粒重。对这些基因的研究有助于我们更好地理解植物种子发育的分子机制,为作物改良和农业生产提供理论基础。

2025-05-19 16:36:23 888

原创 禾本科植物胚乳的发育

在草类植物中,胚乳的发育具有相当的一致性,特别是在早期阶段(Weatherwax,1930;通常,大多数草类植物的胚乳在成熟时是淀粉质和干燥的,这当然是一个有价值的特性,但也有例外。例如,在对169个草类属(占该科总属数的25%以上)的调查中,发现有30个属在成熟时具有液态或软质胚乳的物种,胚乳的粘性状态可以保持几十年。胚乳是由胚囊中央细胞中的两个极核与一个精子细胞核受精产生的,这产生了一个三倍体(3n,3C)的核,而二倍体(2n,2C)的胚则起源于第二个精子细胞核与卵细胞的受精。

2025-05-18 23:52:13 550

原创 R for Data Science(3)

重点:介绍了dplyr包中用于操作数据框的工具,包括行操作、列操作和组操作。下一步:深入学习特定类型数据的转换方法(如数字、字符串、日期等)。

2025-05-18 14:30:19 1095

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除