多组学
文章平均质量分 88
让学习成为一种生活方式
中国医学科学院&北京协和医学院研究生一枚,生物信息学+合成生物学欢迎交流。如切如嗟,如琢如磨!
展开
-
甘蔗基因组--文献精读30
甘蔗是一种具有重要经济和工业价值的作物。然而,由于其高倍性和两个亚基因组之间广泛的重组,栽培甘蔗的超复杂基因组仍未得到解决。在这里,我们为杂交甘蔗品种中蔗1号生成了染色体级、单倍型解析的基因组组装。该组装包含10.4 Gb的基因组序列和68,509个注释基因,这些基因分布在99条原始染色体和15条重组染色体中的两个亚基因组中。RNA-seq数据分析显示,与糖积累相关的基因家族主要从ZZSO亚基因组扩展出来。然而,响应pokkah boeng病易感性的基因主要来自ZZSS亚基因组。原创 2024-07-11 22:27:24 · 452 阅读 · 0 评论 -
光荚含羞草基因组-文献精读26
光荚含羞草起源于热带美洲,具有独特的叶片运动特征,其运动速度相对较慢。此外,这种植物还具有固氮能力。尽管这些特性引人入胜,但由于缺乏光荚含羞草的基因组资源,相关综合研究一直受阻。原创 2024-07-01 20:14:34 · 883 阅读 · 0 评论 -
MEME使用-motif分析(生物信息学工具-24)
在DNA或蛋白的同源序列中,不同位点的保守程度是不一样的,一般来说,对DNA或蛋白质功能和结构影响比较大的位点会比较保守,其它位点则不是很保守。motif最先是通过实验的方法发现的。张国莉,周倩怡,余小奎,等. 基于转录组的大蒜水通道蛋白基因家族的鉴定与分析 [J/OL]. 分子植物育种, 1-26[2024-06-20]. http://101.42.170.182:8085/kcms/detail/46.1068.S.20240614.1749.008.html.原创 2024-06-20 14:15:04 · 2530 阅读 · 0 评论 -
辣椒属2个T2T基因组-文献精读23
辣椒(Capsicum)因其果实中含有辣椒素而闻名,这使其具有独特的辣味。然而,由于缺乏高质量的辣椒基因组,辣椒素生物合成的进化历史及其组织特异性机制仍然不清楚。在本研究中,我们报告了辣椒和其野生无辣味近缘种C. rhomboideum的两条端粒到端粒(T2T)无缝基因组,以研究辣椒果实辣味的进化。我们精确描绘了辣椒的着丝粒,这些着丝粒缺乏高拷贝串联重复序列,但被大量的CRM逆转录转座子入侵。通过系统基因组学分析,我们估算了辣椒素生物合成的进化时间。原创 2024-06-14 15:28:02 · 731 阅读 · 0 评论 -
破布叶(Microcos paniculata)单倍型染色体级别基因组-文献精读22
布渣叶(Microcos paniculata)是一种传统上用作民间药物和制作草药茶的灌木。之前对该物种的研究主要集中在其化学成分和药用价值上。然而,缺乏参考基因组限制了对该物种活性化合物分子机制的研究。在此,我们基于PacBio HiFi和Hi-C数据组装了M. paniculata的单倍型解析染色体级别基因组。组装包含两个单倍体基因组,大小分别为399.43 Mb和393.10 Mb,Contig N50长度分别为43.44 Mb和30.17 Mb。约99.93%的组装序列可以锚定到18条伪染色体。原创 2024-06-13 21:14:10 · 1110 阅读 · 0 评论 -
pESC-HIS是什么,怎么看?-实验操作系列-2
质粒类型:酿酒酵母蛋白表达载体表达水平:高拷贝诱导方法:半乳糖启动子:GAL1和GAL10克隆方法:多克隆位点,限制性内切酶载体大小:6706bp5' 测序引物及序列:3' 测序引物及序列:载体标签:C-Flag,C-Myc载体抗性:氨苄筛选标记:His3备注:利用半乳糖诱导,可以同时使两个基因在酿酒酵母中表达,这个就是双表达载体,可以很好的执行一个功能基因和一个协调辅助蛋白基因的表达,发挥两个蛋白的协同作用,比如伴侣蛋白,协调手性形成蛋白等等。原创 2024-06-06 22:21:30 · 458 阅读 · 0 评论 -
两种参与茶树O-甲基化儿茶素生物合成的O-甲基转移酶的特征分析-文献精读20
茶叶因其高含量的儿茶素而闻名,主要成分是(−)-表没食子儿茶素没食子酸酯(EGCG),具有显著的生物活性,包括潜在的抗癌和抗炎活性。然而,EGCG在肠道中的稳定性和渗透性差,削弱了这些健康益处。某些茶树品种中低含量的O-甲基化EGCG衍生物由于其增加的生物利用度而引起了极大的关注。在此,我们鉴定了来自茶树的两种O-甲基转移酶:CsFAOMT1具有对EGCG的3ʹʹ位特异性O-甲基转移酶活性,可生成EGCG3ʹʹMe,而CsFAOMT2主要催化EGCG4ʹʹMe的形成。原创 2024-06-04 21:50:04 · 1381 阅读 · 0 评论 -
茶树三维基因组-文献精读19
基于PCA的分析(详见在线补充资料中的材料和方法)显示,100 kb分辨率的Hi-C接触数据中,约有48.87%和51.13%的TGY基因组分别属于841个A和826个B区,包含27,642个和17,593个基因,而A和B区的百分比在染色体间存在差异(图1B;图S1,见在线补充资料)。根据环锚点是否与基因重叠,我们将总环细分为55,568个基因间-基因间环、43,383个基因-基因间环和26,453个基因-基因环,这意味着大多数环通过远距离调节元件(富集在基因间区域)与基因之间的相互作用来调节基因表达。原创 2024-06-04 10:36:04 · 790 阅读 · 0 评论 -
光皮树(光皮梾木)基因组-文献精读18
光皮梾木 W. 是一种木本油料植物,含油量高且具有强大的降血脂效果,使其成为中国药用、园林景观和生态目的的宝贵物种。为了推进这一物种的遗传研究,我们利用PacBio和Hi-C数据创建了光皮梾木的草图基因组组装。基于一个锚定了11条染色体的染色体级组装,估计基因组大小为843.51 Mb。N50 contig大小和N50 scaffold大小分别计算为4.49 Mb和78.00 Mb。此外,注释了30,474个编码蛋白基因。比较基因组学分析显示,光皮梾木在大约12.46百万年前(Mya)与其最近的物种分化。原创 2024-06-03 16:43:32 · 893 阅读 · 0 评论 -
康乃馨基因组-文献精读15
康乃馨(Dianthus caryophyllus)是世界上最受欢迎的观赏花卉之一。尽管已有众多关于康乃馨的研究,但花的颜色、香气以及复瓣花的形成机制尚不明确。在这里,我们采用了一种综合多组学方法来阐明康乃馨花卉最重要的观赏性状的遗传和生化途径。首先,我们组装了一个高质量的染色体级康乃馨基因组('Scarlet Queen',636Mb,contig N50为14.67Mb)。接下来,通过多种仪器类型从花的不同部位在多个发育阶段生成了一系列代谢组数据集,以评估色素和挥发性化合物积累的空间和时间差异。原创 2024-05-21 00:18:24 · 995 阅读 · 0 评论 -
pET-28a(+)是什么,怎么看?-实验操作系列-1
带温度标记的质粒图谱详见下载文件,祝PCR顺利!原创 2024-04-23 10:33:38 · 1832 阅读 · 0 评论 -
比较转录组学方法推断基因共表达网络及其在玉米和水稻叶片转录组中的应用 TO-GCN时序分析-文献精读-8
在不同条件下获得的生物过程的时间序列转录组有助于识别该过程的调节因子及其调节网络。然而,这类数据是3D的(基因表达、时间和条件),目前还没有方法能够处理它们的全部复杂性。在这里,我们开发了一种避免在条件间进行时间点对齐和标准化的方法。我们将其应用于分析在光暗周期及全黑暗条件下玉米叶片发育的时间序列转录组,获得了八个时间有序的基因共表达网络(TO-GCNs),这些网络可以用来预测GCNs中任何基因的上游调节因子。原创 2024-04-19 20:20:46 · 991 阅读 · 0 评论 -
蛋白质亚细胞定位预测(生物信息学工具-017)
蛋白质亚细胞定位预测,论文必备工具原创 2024-04-19 16:41:30 · 688 阅读 · 0 评论 -
蛋白质基本信息分析--理化性质如分子量、等电点、不稳定系数等计算分析(生物信息学工具-016)
蛋白质基本信息分析--需要蛋白质的理化性质计算及分析,如分子量、等电点、不稳定系数、脂肪指数、亲水系数等计算分析。原创 2024-04-19 11:12:34 · 1030 阅读 · 0 评论 -
分析染色体级别的基因组装配揭示了六倍体栽培菊花的起源和进化-文献精读-7
六倍体基因组,菊花--钟山紫桂品种六倍体基因组原创 2024-04-10 21:20:35 · 1086 阅读 · 0 评论 -
端到端单倍型参考基因组揭示了三倍体香芽蕉型香蕉亚基因组的分歧和疾病抵抗力-文献精读-5
三倍体基因组-香蕉原创 2024-04-07 21:28:12 · 1093 阅读 · 0 评论 -
RAxML-NG安装与使用-raxml-ng-v1.2.0(bioinfomatics tools-013)
在这里,我们介绍我们的新代码RAxML-NG(RAxML下一代)。它结合了RAxML和ExaML的优势和概念,并提供了我们在下一节中将描述的几项额外改进。所以,ML建树的最新一代版本软件,横空出世,一代版本一代神,代代版本ML树!原创 2024-03-16 23:24:42 · 2199 阅读 · 1 评论 -
seqtk安装与使用-seqtk-1.4(bioinfomatics tools-012)
两款fasta或fastq序列神器-Seqtk和SeqKit!常用生信胶水!原创 2024-03-13 21:05:32 · 2171 阅读 · 0 评论 -
什么是R语言?什么是R包?-R语言001
什么是R语言?什么是R包?R在生物信息学扮演什么角色?原创 2024-03-12 18:57:35 · 1476 阅读 · 1 评论 -
Samtools安装与使用-samtools-v1.17(bioinfomatics tools-007)
SAM、BAM文件及SAMtools,SNP的研究需要!生信胶水之一!原创 2024-03-06 23:00:16 · 3923 阅读 · 3 评论 -
Trinity安装与使用-Trinity-v2.15.1(bioinfomatics tools-006)
转录组的组装神器-Trinity。生命科学发展到现在,生科口的科研人员谁还不会转录组组装及其分析呢?先学会走路--转录本组装!原创 2024-03-05 21:17:07 · 3445 阅读 · 0 评论 -
cd-hit安装与使用-cd-hit v4.8.1(bioinfomatics tools-005)
CD-HIT (Cluster Database at High Identity with Tolerance) 是一种广泛使用的生物信息学工具,主要用于快速聚类生物序列数据,如蛋白质或核酸序列,以减少数据冗余和简化数据分析。其基本原理涉及比较序列之间的相似性,将高度相似的序列分组到同一个聚类中,从而减少数据集的复杂性。原创 2024-03-03 23:14:57 · 3446 阅读 · 0 评论 -
MAFFT安装及使用-mafft v7.520(bioinfomatics tools-004)
多序列比对是生物信息学的一个重要研究内容,比对结果高度依赖于比对工具的参数设置,包括空位罚分(GOP和GEP)以及替换矩阵。MAFFT多序列比对解决了这个问题。原创 2024-03-02 20:49:52 · 3247 阅读 · 2 评论 -
seqkit安装与使用 v2.5.1(生物信息学工具-003)
SeqKit - 跨平台且极速的FASTA/Q文件操作工具包,生信胶水之一。原创 2024-02-23 23:56:34 · 1575 阅读 · 0 评论 -
fastp安装及使用-fastp v0.23.4(bioinfomatics tools-002)
下一代测序技术产生大量的测序数据,可以用于不同的生物学处理流程如基因组、转录组分析等。但是,不同的流程都需要通过质量控制(Quality Control, QC)以获得高质量、纯净的测序数据,从而使后续处理流程得到的结果更加可靠。--fastp原创 2024-02-22 14:41:27 · 4598 阅读 · 0 评论