自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

BioinfoDu

​小杜的生信筆記 ,主要发表或收录生物信息学的教程和基于R的分析和可视化(包括数据分析,图形绘制等)。

  • 博客(278)
  • 收藏
  • 关注

原创 基于R语言绘制网络图,新人选手上手

本文介绍了如何使用ggNetView包绘制网络图。首先详细说明了安装前的准备工作,包括R版本升级、Rtools安装以及R包路径设置。接着讲解了安装过程中可能遇到的问题及解决方法,如升级BiocManager包、安装SpiecEasi和mascarade包等。最后展示了如何使用该包构建网络图并进行可视化,包括基本网络图和带有模块信息的网络图绘制。文章提供了完整的代码示例和效果图,帮助读者快速掌握该工具的使用方法。

2025-12-12 19:41:08 800

原创 SNP曼哈顿图绘制

本文介绍了使用R语言绘制SNP曼哈顿图的方法,用于可视化基因组各染色体上SNP位点的FST值分布。FST值反映群体遗传分化程度,数值越高差异越大。教程提供了完整的R脚本代码,通过输入包含SNP位置和FST值的数据文件,可生成彩色曼哈顿图,并支持设置染色体数量、名称前缀和FST阈值等参数。该方法适用于群体遗传学研究,能直观展示基因组范围内的遗传变异模式。运行示例展示了如何分析马铃薯12条染色体的SNP数据,输出PDF格式的结果图。

2025-11-27 11:17:56 908

原创 使用R语言绘制SNP曼哈顿图

本文介绍了使用R语言绘制SNP曼哈顿图的方法,用于展示基因组各染色体上SNP位点的FST值分布。FST值衡量群体遗传分化程度,数值越高差异越大。教程提供了完整的R脚本代码,通过命令行参数指定输入数据、输出文件名、染色体数量、染色体前缀和FST阈值。脚本采用交替颜色区分不同染色体,并绘制阈值参考线。该可视化方法适用于群体遗传学研究,能够直观显示基因组中显著分化的区域。文章还提供了参数说明和运行示例,方便研究人员直接应用。

2025-11-27 11:12:17 821

原创 一区 | 河南大学油菜科研团队发现平衡油菜“耐旱-稳产”的关键调控因子,在一区期刊发表

该研究在甘蓝型油菜中发现了一个参与干旱胁迫应答的关键转录因子BnNAC038,系统解析了其协调植物干旱应答与产量平衡的分子网络,为突破作物育种中“生长与防御”难以协同的瓶颈问题、实现“耐旱不减产”的育种目标提供了关键基因资源与创新育种策略。尤为关键的是,连续两年的田间试验证实,bnnac038植株在增强了耐旱性的同时,最大限度地减少了产量损失:在正常条件下生长发育和产量与野生型无显著差异,而在干旱胁迫下,其光合能力更强、蔗糖与葡萄糖积累更多,最终生物量与种子产量的损失均显著低于野生型。教授为共同通讯作者。

2025-11-19 17:51:18 291

原创 Plant Journal | 河南大学油菜科研团队发现平衡油菜“耐旱-稳产”的关键调控因子,为作物抗逆育种提供新策略

河南大学王道杰教授团队在《The Plant Journal》发表研究,发现油菜转录因子BnNAC038是平衡"耐旱-稳产"的关键调控因子。通过CRISPR/Cas9敲除该基因,突变体在干旱条件下表现出增强的耐旱性,同时产量损失显著低于野生型。研究发现BnNAC038通过双重抑制机制:一方面抑制ABA信号通路关键基因BnSnRK2.6的表达,负调控干旱应答;另一方面抑制光合作用和糖代谢相关基因BnPPC2和BnPGK的表达。敲除该基因后,植株能更快速关闭气孔减少水分流失,同时维持更高光合

2025-11-19 17:50:06 438

原创 WGAS学习代码

这篇教程介绍了全基因组关联分析(WGAS)的关键方法和流程,包括数据质量控制、群体结构分析和关联分析方法。主要内容涵盖基因型/表型数据处理(1_QC_GWAS)、群体分层校正(2_Population_stratification)以及GLM、MLM等GWAS模型应用(3_Association_GWAS)。教程特别强调了模型选择、多重假设检验校正(Bonferroni/FDR)等核心环节,提供了完整的代码实现(1_Main_script_QC_GWAS.txt)。该资源已在Github获得900+星标,包

2025-11-17 18:04:02 323

原创 华中农大丁广大课题组在中科院一区Top期刊Trends in Plant Science发表论文

华中农大丁广大团队联合澳大利亚乐卓博大学在《Trends in Plant Science》发表综述,系统评述酸性土壤治理技术。研究指出土壤酸化(pH<5.5)会引发有毒金属释放、微生物失衡及养分流失等问题。团队提出"传统+现代"协同修复策略:1)精准农业实现按需改良;2)基因编辑培育耐酸品种;3)纳米材料保护根系;4)微生物接种恢复土壤活力。同时强调需平衡高科技方案与低成本农艺措施的应用。该研究为酸性土壤治理和粮食安全提供了创新解决方案。

2025-11-10 19:16:18 1004

原创 华中农大丁广大课题组联合澳大利亚乐卓博大学Surya Kant团队在Trends in Plant Science发表论文

华中农大丁广大课题组联合澳大利亚乐卓博大学Surya Kant团队在《Trends in Plant Science》发表酸性土壤可持续修复技术综述。研究指出全球土壤酸化导致金属毒性、微生物失衡和养分流失三大危害,提出"传统+现代"协同修复方案:精准农业监测、耐酸作物育种、纳米材料保护和微生物接种。同时强调需兼顾成本效益,结合绿肥种植等低成本措施。该研究为酸性土壤改良和粮食安全保障提供了创新思路。

2025-11-10 19:14:59 1109

原创 Chip-seq上游分析教程,从fq到数据

本文介绍了ChIP-seq上游分析流程,包括数据下载、质量控制、基因组比对、去重处理、样本重命名、峰值检测等步骤。作者使用番茄ChIP-seq数据作为示例,提供了详细的代码和文件结构说明。分析过程中采用了Singularity容器封装常用软件(如MACS2、bedtools等),方便直接使用。教程整合了多个优秀参考资料,强调实际操作的重要性,建议读者结合具体数据验证代码。文章还提供了分析流程的图形展示和完整的文件目录结构,可供初学者参考学习。

2025-10-14 17:46:35 1252

原创 Chip-seq上游分析流程 (附代码) | 新手可入

本文分享了一个ChIP-seq上游分析流程教程,包含从原始数据下载到peak calling的完整步骤。教程基于番茄ChIP-seq数据(PRJNA1124576),提供了详细代码和Singularity容器封装的主流软件(如fastp、bowtie2、MACS2等)。分析流程涵盖数据质控、比对、去重、peak calling等环节,并附有可视化结果(如peak热图)。特别适合新手学习实践,所有资源可通过社群获取。文中还整合了多个优质参考教程,建议读者结合自身时间选择性学习。

2025-10-14 17:45:39 1053

原创 Cell | 细菌系统发育树绘制(附代码和数据)

本文分享了基因组分析教程的数据准备文件"genomes_metadata.txt",包含根际细菌的基因组信息。该数据集记录了基因组ID、宿主来源、基因组类型、质量指标(完整性、污染度)、GC含量、基因数量等特征,以及分类学信息。文件还包含植物关联特征如是否作物、是否谷物等标记。获取完整教程可在公众号后台回复"20250928"。这些高质量分离株基因组数据可用于微生物组与植物互作研究。

2025-09-28 14:24:34 509

原创 Cell | 细菌系统发育树绘制(附代码和数据)

本文提供了一组高质量细菌基因组数据,包含多个从紫花苜蓿根部分离的细菌菌株。数据文件"genomes_metadata.txt"详细记录了各菌株的基因组特征,包括宿主信息、基因组类型、质量评估指标(完整度、污染率等)、基因组大小、GC含量、分类学信息等。这些数据可用于微生物组学研究,特别是植物根际微生物群落分析。读者可通过在公众号后台回复关键词"20250928"获取完整数据和代码。

2025-09-28 14:09:23 447

原创 Nature顶刊发表单细胞文章,并提供了全文分析代码R+python,2024年预印版发布,2025年正式发表于Nature

摘要 杜克大学研究团队在《Nature》发表最新成果,揭示了基底细胞作为小细胞肺癌(SCLC)等神经内分泌-簇状癌症的起源。研究发现,源自基底细胞的肿瘤表现出与人类SCLC高度相似的特征,并首次发现Atoh1+转录状态。通过单细胞克隆分析,团队揭示了神经内分泌-簇状可塑性的谱系轨迹机制。研究还发现,基底细胞中MYC高表达、PTEN缺失和ASCL1抑制等遗传改变会协同促进簇状肿瘤形成。对944个人类SCLC样本的转录组分析确认了基底样亚群的存在,为理解肿瘤异质性和靶向谱系可塑性提供了新思路。作者已公开全部分析

2025-09-25 23:09:57 1217

原创 基于全基因组做UGT基因家族,发Top期刊(纯生信)

原文链接:https://doi.org/10.1093/hr/uhaf204PDF预印版:https://academic.oup.com/hr/advance-article-pdf/doi/10.1093/hr/uhaf204/63899420/uhaf204.pdf。

2025-09-25 22:57:21 408

原创 如何高效使用Xshell和finalshell连接服务器,简单&高效

本文介绍了两种常用的服务器连接工具Xshell和Finalshell的使用方法。文章首先分享了作者学习Linux和生物信息学的经历,建议初学者不要浪费精力在本地虚拟机安装Linux系统,推荐使用云服务器。详细讲解了Xshell和Finalshell的下载安装步骤,包括官网下载地址和网盘资源分享。重点演示了两种工具如何连接服务器的具体操作流程,并对比了它们的界面特点。作者还提供了相关软件的云盘下载链接,方便读者获取。文章以实用基础内容为主,旨在帮助生物信息学初学者快速掌握服务器连接工具的使用。

2025-09-24 18:37:23 1278

原创 生信软件管理, 容器-Singularity学习笔记

2025-09-09 17:23:36 280

原创 “开源宇宙”的显卡拓展坞用户者,我被客服拉黑了.......??

此推文是一个吐槽的推文,大家可以抱着吃瓜的心态观看。其实,自己并不想发次牢骚,但是,开源宇宙开源宇宙GPU oculink(目前);开源宇宙GPU服务器工厂)的做法实在让消费者难看。开源、拓展坞之类的产品,不可否认,他们在“开源”这块做的确实不错。自己也是很早以前就知道他们,也关注过他们的产品。此外,也购买了他们的oculink拓展坞。当时,我们的也就此出了学生及科研人员电脑配置推荐 | 笔记本+外置显卡配置,性能足够支持完成你博士论文文本内容,在此文章中,我们也对此介绍了开源宇宙的拓展坞优缺点。注意。

2025-09-08 14:32:21 992

原创 GO富集分析,TopGO包,你用不?

推荐大家购买最新的教程,若是已经购买以前WGNCA教程的同学,可以在对应教程留言,即可获得最新的教程。(注:此教程也仅基于自己理解,不仅局限于此,难免有不恰当地方,请结合自己需求,进行改动。今天在一篇文章中看到,使用这个包,因此也来分享一下。,注于分享生物信息学相关知识和R语言绘图教程。对于TopGO包感兴趣的同学可以了解一下教程。

2025-09-04 19:03:04 441

原创 植物中lncRNA鉴定和注释流程,代码(包含Identified,Classification,WGCNA.....)

推荐大家购买最新的教程,若是已经购买以前WGNCA教程的同学,可以在对应教程留言,即可获得最新的教程。(注:此教程也仅基于自己理解,不仅局限于此,难免有不恰当地方,请结合自己需求,进行改动。,注于分享生物信息学相关知识和R语言绘图教程。

2025-09-01 20:07:41 1314

原创 Q1 Top IF 18.7 | 基于泛基因组揭示植物NLR进化

标题:Pangenomic context reveals the extent of intraspecific plant NLR evolution。文章DOI: 10.1016/j.chom.2025.07.011。期刊:Cell Hose & Microbe。

2025-08-31 18:29:37 205

原创 基于R语言,“上百种机器学习模型”学习教程 | Mime包

本文介绍了基于R语言的Mime机器学习框架,用于构建和可视化临床特征预测模型。该框架支持上百种机器学习算法,可用于预后预测和特征选择。文章提供了详细的安装指南(包括Bioconductor和GitHub依赖包)及使用示例,展示了如何利用基因表达数据和临床信息构建预后模型。通过ML.Dev.Prog.Sig函数可筛选最优算法组合,并可视化模型性能(如C-index)和生存曲线分析。该工具特别适用于100+样本量和50+基因的研究场景,为临床预测建模提供了灵活高效的解决方案。

2025-08-08 19:03:25 1609 1

转载 做生物信息学为何要使用服务器?生信虽好,但得学啊!

本文介绍了生信分析中推荐使用服务器的原因及优势。作者指出,个人电脑虽可完成部分分析,但在处理单细胞、基因组等复杂数据时性能不足。自配服务器存在电费、运维等隐性成本,而云服务器(如西柚云)则提供了便捷、高性能的解决方案,无需设备维护,支持开具发票报销。文章还提供了西柚云服务器的优惠链接和操作指南,帮助用户快速选择适合的配置。

2025-08-08 15:33:30 814

原创 一区Top期刊 Acceptance Rate: 5%,接受率为5%

一区Top期刊 Acceptance Rate: 5%,接受率为5%期刊:Journal of Advanced Research国家:Netherlands出版社:Elsevier B.V.影响因子:JIF5=11.6JCR分区:Q1中科院大类:1Top:是Open Acess:是。

2025-07-29 20:32:34 801

原创 哈哈哈,我时隔2年的投稿“征程”,我想不只是我遇到这样的“遭遇”吧。投稿2年,我都结婚了......

了解我的人知道,我不是一个喜欢“惹事”的人;我也并不是一个喜欢“吐槽”的人;此外,我也并不是一个有很强“分享欲”的人(PS:这一点我媳妇说的)。投稿时一门艺术,也是一种技术,亦或是一门学问。最终,是何种结果,未知未知…我2023年8月投稿的Manuscript参考文献比较少,我可能要引言一篇文章,2024年6月投稿,2024年9月接收,2024年9月19日Available online。同志们,不说了!动起来!修改吧!Accepted!Accepted!

2025-07-25 09:36:51 1258

原创 我时隔2年的投稿“征程”,我想不只是我遇到这样的“遭遇”吧

了解我的人知道,我不是一个喜欢“惹事”的人;我也并不是一个喜欢“吐槽”的人;此外,我也并不是一个有很强“分享欲”的人(PS:这一点我媳妇说的)。投稿时一门艺术,也是一种技术,亦或是一门学问。最终,是何种结果,未知未知…我2023年8月投稿的Manuscript参考文献比较少,我可能要引言一篇文章,2024年6月投稿,2024年9月接收,2024年9月19日Available online。同志们,不说了!动起来!修改吧!Accepted!Accepted!

2025-07-25 09:35:42 1211

原创 如何实现快速解压SRA文件 | 你是使用fastq-dump(单线程)还是pfastq-dump(多线程)

在公共数据库中下载二代、三代组学数据,通常下载的格式为.sra格式。我们需要将其转换为fq格式,在NCBI官网给推荐使用的是(下载+转换工具)。你也可以使用Kingfisher软件一键下载。然而,fastq-dump进行数据转换仅支持单线程,速度较慢,服务器的性能也剩余过多。那么如何实现多线程呢?我们推荐使用软件,属于fastq-dump的多线程版本。若你无法访问github,我们也进行最新版本的下载,后台回复关键词,即可获得本期教程软件:20250718fastq-dump。

2025-07-18 15:37:24 1196

原创 做生物信息学为何要使用服务器?生信虽好,但得学啊!

生物信息学分析推荐使用服务器而非个人电脑,主要原因包括:1)个人电脑仅能完成部分基础分析,如转录组等;2)高性能分析(单细胞、基因组等)需要大内存和计算资源;3)自建服务器存在运维、电费等隐性成本(如800W电源年电费约3504元);4)云服务器(如西柚云)提供便捷、高性能的解决方案,无需维护且网络访问快。建议根据分析需求和预算选择合适的计算资源,课题组无服务器的可优先考虑云服务方案。

2025-07-17 17:50:18 554

原创 Nature Communication | 百合染色体基因组,PacBio HiFI+Hi-C,如何发top级别的“水刊”(PS:你有NC更厉害的期刊,可以这样“称呼”)??

AS事件以A3(32.67%)和RI(27.40%)为主(图4a),LTR/LINE插入密度与高剪接效率(PSI)正相关(图4c, d);**结果:**10 kb长基因占80%,内含子平均4.68 kb,72.52%由TE插入导致(图3a–c);**结果:**重复序列占80.06%,LTR反转座子为主(72.3%),其中Tekay(Gypsy)和Athila为优势亚家族(图2a, b)。**方法:**Hi-C数据构建3D模型,分析染色质区室(A/B)和拓扑关联域(TAD)。

2025-07-17 16:58:34 1182

原创 Nature Communication | 百合染色体基因组,PacBio HiFI+Hi-C,基因组大小35.6G

该研究首次利用PacBio HiFi和Hi-C测序技术,构建了百合高质量染色体级参考基因组(35.6 Gb),解析了其基因组扩张的驱动因素及适应性进化机制。

2025-07-17 16:50:18 1421

原创 WGAS+WGCNA分析文章套路

最后,EV.TU.CH8.1956 (TYRAAT) 在苯丙氨酸、酪氨酸和色氨酸生物合成的 24 小时和 48 小时分别在 300 mmol・L-1 和 500 mmol・L-1 处上调 (图 S4 和 B)。其中,三种 c-DEGs 在蛋白酶体 (evm.TU.Chr5.6367 和 evm.TU.Chr3.100)、醚脂质代谢 (evm.TU.Chr2.4513)、甘油磷脂代谢 (evm.TU.Chr2・4513) 和内吞作用 (evm.TU.Chr2.4013) 途径中显著富集 (图 4,B)。

2025-07-15 22:21:10 833

原创 一区 Top (HPJ) | WGAS+WGCNA分析文章套路

对于二萜类生物合成,EV.TU.Ch2.6477 (CYP82G1) 基因在24小时内在 500 mmol・L-1 处上调。EV.TU.Ch4.18379 (GID1) 基因在 CK 处上调,在 24 小时内在 100 mmol・L-1 处上调,在 6 小时和 48 小时内在 500 μmol・L-1 处上调,而 EV.TU.Ch8.3950 (MYC2) 基因在植物激素信号转导中在 24 小时内在 300 mmol・L-1 处上调和在 6 小时和 24 小时内在 500 mmol.L-1 处上调。

2025-07-15 22:18:48 1013

原创 条形图 | 近单倍体,Genetic heterogeneity elucidated by inferCNV

推荐大家购买最新的教程,若是已经购买以前WGNCA教程的同学,可以在对应教程留言,即可获得最新的教程。(注:此教程也仅基于自己理解,不仅局限于此,难免有不恰当地方,请结合自己需求,进行改动。在后台回复关键词即可获得教程代码:20250708。在后台回复关键词即可获得教程代码:20250708。,注于分享生物信息学相关知识和R语言绘图教程。

2025-07-08 14:49:41 1237

原创 植物small RNA靶基因预测软件,psRobot

推荐大家购买最新的教程,若是已经购买以前WGNCA教程的同学,可以在对应教程留言,即可获得最新的教程。(注:此教程也仅基于自己理解,不仅局限于此,难免有不恰当地方,请结合自己需求,进行改动。psRobot_mir旨在从高通量测序数据中为一批输入序列寻找具有茎环前体的小RNA(如miRNA或shRNA)psRobot_map 用于在较长的参考序列中找到短序列(小于 40bp)的所有完美匹配位置;

2025-07-01 22:18:34 667

原创 如何使用bedtools、convert2bed、gff2bed提取基因序列

我们的使用基因组注释文件gtf或gff文件从基因组fa文件中提取transcript的方式很多,相对用的比较多的是使用gffread软件。但是gffread软件,提取的序列一般都是transcript序列,若是,我们的想提取的gene序列,那么不能直接使用基因组gtf文件。本次,我们介绍其中的一种方法。使用提取gene全长序列。注意:这仅仅只是其中的一种方法而已。

2025-07-01 22:00:11 1533

原创 SeqKit软件的使用

由于微信改版,一直有同学反映。存在长时间接收不到公众号的推文。那么请跟随以下步骤,将设置为,不错过每一条推文教程。

2025-06-26 13:43:18 1082

原创 一文了解序列提取软件 | seqkit

由于微信改版,一直有同学反映。存在长时间接收不到公众号的推文。那么请跟随以下步骤,将设置为,不错过每一条推文教程。

2025-06-26 13:42:43 1456

原创 单体型分析(haplotype-graph analysis)

推荐大家购买最新的教程,若是已经购买以前WGNCA教程的同学,可以在对应教程留言,即可获得最新的教程。(注:此教程也仅基于自己理解,不仅局限于此,难免有不恰当地方,请结合自己需求,进行改动。,注于分享生物信息学相关知识和R语言绘图教程。提供了所有的分析脚本文件,可以直接。

2025-06-20 14:03:19 443

原创 泛基因组组装 | 单体型分析(haplotype-graph analysis) (三)

推荐大家购买最新的教程,若是已经购买以前WGNCA教程的同学,可以在对应教程留言,即可获得最新的教程。(注:此教程也仅基于自己理解,不仅局限于此,难免有不恰当地方,请结合自己需求,进行改动。,注于分享生物信息学相关知识和R语言绘图教程。提供了所有的分析脚本文件,可以直接。

2025-06-20 14:00:00 1154

原创 最新期刊影响因子,基本包含全部期刊

BioinfoR生信筆記 ,注于分享生物信息学相关知识和R语言绘图教程。2024年期刊最新影响因子(IF)

2025-06-18 21:30:20 358

原创 Nature | 四倍体马铃薯泛基因组组装 | Hi-C和long read sequencing组装 (一)

前面我们分享了Nature,大麻泛基因组(Pangenome)的分析流程,作者提供较为详细的代码。需要我们同学自己进行认真的学习,去了解。换句话说,我们任何内容/知识,不都是需要自己进行学习的吗?今天,我们分享的是四倍体马铃薯泛基因组的组装教程。此文章,作者也提供较为详细的代码,需要认真学习。

2025-06-16 22:51:36 1127 5

2024年所有SCI期刊最新影响因子

2024年所有SCI期刊最新影响因子

2025-06-18

complexUpset图绘制教程

关于《R语言绘图专栏》,此专栏基于R语言绘制图形。每个图形我们会提供对应的R代码、数据和文本文档。此系列将会是一个长期更新的系列。

2024-08-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除