自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(19)
  • 资源 (4)
  • 收藏
  • 关注

原创 2020.11.9【WGS/GWAS】丨全基因组分析(关联分析)全流程(下)

经过为期半个月的~~东拼西凑~~ 研发测试,作者终于整理出了一个从VCF开始的GWAS后期分析流程。当然要感谢很多大佬提供的~~代码~~ 帮助,在文章中也附上参考链接。对GWAS还不够熟悉的朋友,可以看一下我之前整理的一份PPT学习笔记[《遗传进化与GWAS研究》](https://blog.csdn.net/yangl7/article/details/108486232)。

2020-11-09 14:36:28 16009 10

原创 2020.11.30【读书笔记】丨在本地运行NCBI细菌基因组注释工具(PGAP)

Annotation in the biological analysis workflow importance of gene annotation in whole-genome analyses PGAP in brief automated pipeline Protein-coding gene prediction protein homology Ab initio calls Hidden Markov Model non-coding

2020-11-30 16:08:06 1906

原创 2020.11.26丨sam转换bam格式报错parse error at line 1解决办法

今天照常进行比对工作,涉及到某一个样品需要比对,于是将.sh文件里的脚本直接复制粘贴出来,去掉了循环开始跑,结果是没问题的,但是在下一步使用samtools进行转换的时候发生了报错 parse error at line 1 truncated file. 网上查了一下,发现是bwa可能存在安装问题,不能使用nohup进行运行。参考链接:sam转bam文件报错 - 简书 (jianshu.com) 取消nohup之后,正常运行...

2020-11-26 15:50:09 4815 1

原创 2020.11.25丨CRISPResso基因编辑分析流程

本文是对综述《Integrated design, execution, and analysis of arrayed and pooled CRISPR genome-editing experiments》step83之后的测序数据分析进行一个概括梳理。 CRISPRessoanalysis of deep-sequencing data Timing:10-120min Experimentalparameter Fastq file R1 Fastq file R2 Ampli.

2020-11-25 10:18:35 2739

原创 2020.11.23【读书笔记】丨生物信息学与功能基因组学(第三章 双序列比对 Dayhoff模型)

Dayhoff模型 第一步:可接受点突变(PAM) 概念:在蛋白质被自然选择接受的单个氨基酸替换 满足情况: 基因发生DNA变异,使得基因编码另一种不同氨基酸 整个种群都接受这种变化,改变后的蛋白质作为种群内蛋白质的优势形式 可被接受的点突变:基于经验统计的保守性替换 使用系统发育分析,将它们与推断的共同祖先进行比对。 基于经验观察的氨基酸替换结果,描述了任意一对氨基酸对比对在一起的频率。 第二步:氨基酸出现的频率

2020-11-23 01:08:37 2146

原创 2020.11.20丨使用GATK CombineGVCFs命令批量合并vcf文件

GATK是一款强大的数据处理软件,最近在优化GWAS流程时遇到一个麻烦事,就是要将各样品的VCF文件进行合并,本来GATK里面有一个可以合并VCF数据的命令 CombineGVCFs,可以将所有样品的VCF合并成一个文件。但是这个命令需要一个一个输入文件名。 熟悉GWAS的小伙伴应该清楚,GWAS项目动辄上百个样品,让人一个一个输入还是很繁琐的。因此我写了个shell脚本,能够快速输入样品名称,并执行CombineGVCFs命令。 脚本 Ref_genome="genome.fna"

2020-11-20 15:20:18 11048 12

原创 2020.11.18丨Multiqc使用对多样本数据进行统计

平时做一些项目,在样品不多的情况下,使用fastqc,可以对每个样品单独生成质控报告。然而,当遇到群体遗传相关的项目、样本数量比较多的时候,则需要统计所有样品生成汇总表,方便观察各样品质控结果。因此我们选择使用Multiqc来对结果进行汇总。 使用软件:Multiqc 安装说明: 官方下载:Release MultiQC Version 1.9 · ewels/MultiQC · GitHub code: gunzip MultiQC-1.9.tar.gz tar -vzf Multi

2020-11-18 11:48:29 971

原创 2020.11.17【读书笔记】丨测序前送样准备&取样要求

制备环节的注意事项 微生物样本取样安全性 注意安全 样本准备与保存方法 植物组织 DNA含量:叶片>花、茎、果实>根、种子 尽量选择新鲜、幼嫩的叶片组织 采集流程 动物组织 DNA 新鲜组织,题除结缔组织等非研究所需的组织类型 预冷的PBS冲洗组织残留血液 混合均匀后冷冻保存 干冰运输 注意事项:样品手机过程保证样品断血后半小时内完成样品制备 动物组织-三代测序 推荐送样 肝脏、肾脏等内脏组织、肌肉组织或者全

2020-11-17 09:23:45 12250

原创 2020.11.17【读书笔记】丨ONT 测序平台送样指导——DNA 取样要求

送样原则 安全 1. 人身安全:现有实验条件下(采取一定防护后),样品对实验人员本身无伤害; 2. 环境安全:样品对室内、室外环境无影响(以免因为不小心导致一些活体样本进入外界环境造成不良影响); 无污染 任何样品除本样品外不得有其他样品的污染, 植物样本不得有其它植物的污染,不得有病害,不得有虫害 全血样品不得引入取血物种本身携带的病菌、病毒等潜在污染 依据理论和实践 “理论”:基于各种实验原理的理论依据; “实践”:基于 BMK 本身积累的多物.

2020-11-17 09:21:06 1605

原创 2020.11.14【读书笔记】丨生物信息学与功能基因组学(第三章 双序列比对 引言)

学习目标 理解同源(包括直系和旁系同源)的含义; 阐释如PAM(可被接受的点突变)矩阵的生成方法; 比较PAM和BLOSUM打分矩阵的用途; 理解动态规划定义,并解释全局和局部序列比对算法是如何工作的; 在NCBI网页上进行蛋白质或DNA的双序列比对 3.1 引言 当完成对多个物种的基因组测序后,一个重要的工作室找到特定物种内和物种之间的蛋白质在进化上的相关性。 序列水平的相关表明两个蛋白质同源 具有相似或者相同的功能 蛋白质比对:通常比DNA比对包含更丰富的信息 DN

2020-11-16 10:19:19 1039

原创 2020.11.16【读书笔记】丨ATAC-seq技术的功能基因组研究

原理介绍 识别染色体开放区域、高信噪比、低成本; 在不同转录因子周围形成特定信号分布模式; 获得大量线粒体来源的测序读长; 不同细胞类型的艰苦条件需要进行摸索 基于表型预测调控关键分子 解析基因组开放区域 基于ATAC-seq的基因组调控网络研究 文章解析富集研究 信号通路 点突变 ...

2020-11-16 10:15:17 251

原创 2020.11.13【读书笔记】丨植物多倍化的表观遗传学研究进展

主办方:诺禾致源 主讲人:四川农业大学草学系黄琳凯教授 内容: 植物多倍体的普遍性和重要性 概念 种类同源多倍体AAAA 异源多倍体AABB 普遍性比如拟南芥、大豆、水稻、高粱和玉米等禾本科植物 重要性 多倍化是植物表观遗传学研究领域的重要内容 植物多倍体对转录调控的影响 RNA的种类 概念 研究方法 多倍化对基因表达的影响 课题组研究 WGCNA分析 miRNA测序 ...

2020-11-13 15:52:41 522

原创 2020.11.13【读书笔记】丨外泌体在心脏疾病中的治疗研究

本次会议笔记为李晓红博士对外泌体在心脏疾病中的治疗研究的会议讲解,笔记截取了部分PPT内容,主办方:诺禾致源 主讲人:广东省心血管病研究所博士李晓红 内容:外泌体在心脏疾病中的治疗研究心血管疾病外泌体研究特点 细胞外囊泡 分类 外泌体来源与分布 2019外泌体的学科中标情况 心血管外泌体特点 外泌体在心血管中的研究进展 心血管疾病高分文章剖析 外泌体RNA 课题组分析流程 测序及生信分析 电镜检测 成分分析

2020-11-13 11:48:47 440

原创 2020.11.12丨tRNAscan-SE-2.0最新安装流程

最近接了一些细菌和真菌做RNA-seq的项目,有客户提到想要获取核糖体RNA(tRNA)的统计结果,之前用sortmerna一个样品都要比对4,5个小时,打算试试tRNAscan-SE。不过安装过程卡了半天,一是官网没有安装说明,二是该软件的安装教程最新也是2017年的,版本和安装方式已经发生了变化。特此写下这篇文章,作为记录。 软件名称:tRNAscan-SE 官网地址:tRNAscan-SE Search Server (ucsc.edu) 下载链接:tRNAscan-SE-2.0.7.tar.g

2020-11-12 16:54:59 1356

原创 2020.11.11丨三代细菌甲基化流程调研

pipeline Figure pipeline Figure http://blog.sina.com.cn/s/blog_12b14648e0102vetw.html http://www.biomarker.com.cn/technology-services/medicine-ont-methylation step.1 quality control fastQC step.2trim trim-.

2020-11-11 09:09:38 494

原创 2020.11.10丨BSA基础知识及产品介绍

产品介绍 BSA产品介绍 1.1研究目的 基因定位 1.2基本概念 Bulked Segregant Analysis,分离群体分组分析法 定义: 在性状分离的遗传群体中 ,选择表型极端差异个体将其DNA等量混合,分别构建DNA混池,与性状 相关SNP的等位位点频率在混池间表现出显著差异, 而非相关SNP的等位位点频率无明显差异,从而可以 通过比较混池间SNP得到候选区间。 原理:等位基因频率差异 1.3技术流程 选择合适亲本构建

2020-11-10 09:45:12 1612

原创 2020.11.3【读书笔记】丨生物信息学与功能基因组学(第二章 序列数据的获取 下)

2.7 基因组浏览器 三个主流基因组浏览器:Ensemble、UCSC和NCBI 基因组组装 定义: 所获得的一个物种DNA序列按照染色体的形式进行的一种组装。 内容: 对基因组的注释,如起止位点、外显子、DNA重复元件或其他基因组特征。 基因组参照联盟(GRC) 维护人类、小鼠和斑马鱼的参考基因组。 对基因组组装需要明确几点: 每个染色体的起止位置是什么 基因组序列中包括多少gap区域,能否被弥补? 基因组上的结构变异位点如何

2020-11-03 23:36:45 1253

原创 2020.11.2【读书笔记】丨生物信息学与功能基因组学(第二章 序列数据的获取 中)

2.4 用于标记和鉴别序列的索引编号 DNA和蛋白质序列记录的重要特征是他们都被打上了索引编号作为标签。索引编号由一段4~12个数字和/或字母组成的编号,每个索引编号与一个分子序列记录相对于。 一个分子对应多个索引编号,这些索引编号可以代表全长/片段,代表核酸/蛋白质,需要尽快熟悉。 参考序列(RefSeq)项目 目的:为每一个基因的正常转录本和正常蛋白质产物提供最有代表性的序列。 对于一个给定的基因或基因产物,只会有一个RefSeq条目;如果基因有可变剪切或是在不同的基因座上,则会有几个Re

2020-11-02 23:31:51 873

原创 2020.11.1【读书笔记】丨生物信息学与功能基因组学(第二章 序列数据的获取 上)

·学习目标 定义分子数据库的类型 定义索引编号和RefSeq标识符的意义 描述主要的基因组浏览器和使用它们来研究基因组区域的特点; 使用数据来研究单个基因(蛋白质)和大量基因、蛋白质的信息 2.1 生物数据库入门介绍 目前,公共数据库已经手机了百万亿(10^15)的DNA核苷酸数据,并很快回答到兆2级别>10^18碱基)的数量。这些数据来自超过三十万个物种。本章目的是介绍存储数据的数据库以及从数据库提取信息的方法。 2.2 集中存储DNA序列的数据库 国际核酸序列数据库(INS

2020-11-02 08:48:08 1287 2

admixture_linux-1.3.0.zip

admixture早期版本,目前官网已经停止维护,需要进行全基因组关联分析的小伙伴们可以取用。该软件主要用于分析群体结构

2020-10-27

固态硬盘选购一览表.xlsx

定义:俗称固态硬盘,固态硬盘是用固态电子存储芯片阵列而制成的硬盘,因为台湾英语里把固体电容称之为Solid而得名。分类:SSD由控制单元和存储单元(FLASH芯片、DRAM芯片)组成。内含三星、金士顿、西部数据3个品牌常用固态硬盘信息整理

2020-08-28

7.17丨服务器性价比调研表.xlsx

这是一个对虚拟云主流市场调研的一份结果汇总,代表了2020.7时期的各大厂商性能价格比较。包括阿里云、腾讯云、华为云、亚马逊四家虚拟云服务以及和物理服务器在性能,价格方面的比较。

2020-08-05

基因ID转name工作台.xlsx

基因ID转name工作台.xlsx,可以将基因I转化为基因name,使用EXCEL处理,上手快速,很适合收藏一份

2020-02-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除