自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 收藏
  • 关注

原创 群体遗传学数学基础

群体遗传学数学基础数学基础一对等位基因孟德尔群体及其数量表示1.群体遗传结构2.基因频率由基因型频率唯一确定3.哈温伯格定律4.平衡群体的性质4.1 Shannon信息熵最大4.2 S(G)=2S(A)遗传多态性1.描述遗传多态性2.杂合度H,群体基因的多样度总结群体中亲属关系研究系统树重建其他参考数学基础以下全明白才能看懂之后的:排列组合数学期望方差求导信息熵拉格朗日乘子法拉格朗...

2019-09-29 13:37:34 3168

原创 生信网站整理

生信网站整理前言生信课程和推荐博客语言PythonRPerl生信分析流程案例GWAS甲基化其他前言在生信学习过程中我保存了很多网站,但是因为没有对网站进行记录和管理经常找不到需要的信息,在这篇博客中将汇总我收藏的生信相关网站(持更)。生信课程和推荐博客这部分网站为大佬分享/大学开设的生信相关课程资料:HarvardX Biomedical Data Science Open Onlin...

2019-05-30 17:14:59 1840

原创 文献翻译:Comparative metagenomics of hydrocarbon and methane seeps of the Gulf of Mexico

Comparative metagenomics of hydrocarbon and methane seeps of the Gulf of Mexico摘要背景结果墨西哥湾沉积物的地球化学特征墨西哥湾沉积物中的微生物丰度墨西哥湾沉积物中的微生物群落组成墨西哥湾沉积物的比较宏基因组分析讨论无活性烃渗漏迹象的沉积物碳氢化合物渗漏与甲烷渗漏方法样品说明定量聚合酶链反应(qPCR)分析Illumina Miseq扩增文库的制备、测序和分析宏基因组文库的制备、测序与分析统计分析https://www.nat

2021-05-02 17:45:54 833

原创 文献翻译:Genomic features of bacterial adaptation to plants

Genomic features of bacterial adaptation to plants摘要背景结果扩展植物相关细菌参考目录一个广泛的,高质量的细菌基因组集合PA基因组:更多的糖代谢,更少的移动元素PA和RA基因的鉴定与验证在不同PA基因组中可重复富集的蛋白质结构域PA和RA蛋白的植物蛋白模拟PA基因簇的共现新推测的PA和RA基因操纵子讨论方法细菌分离与基因组测序3837个分离基因组及其分离位点的数据汇编细菌基因组树的构建3837个基因组聚类成9个类群基因组分析基因组大小比较和基因类别富集分析基

2021-04-29 17:18:22 1542

原创 斯坦福SCI写作公开课目录

Writing in the Sciences第一单元1.1 介绍1.2 不要做什么1.3 高效写作的要点概述1.4 减少句子的混乱1.5 减少句子混乱的更多技巧1.6 减少句子混乱的联系第二单元2.1 使用主动语态2.2 使用we和I是可以的2.3 主动语态联系2.4 用动词写作2.5 联系2.6 一些语法tips第三单元3.1 使用标点符号的经验3.2 练习冒号和破折号3.3 平行结构3.4 段落3.5 更多的段落联系3.6 对于重读和关键的tips第四单元

2021-03-06 19:33:11 672 2

原创 如何自己进行论文投稿

如何自己进行论文投稿1 何时需要自己投稿2 自己投稿前如何跟导师沟通3 投稿杂志选择4 投稿准备5 投稿日挑选1 何时需要自己投稿导师明确表示投稿需要自己进行导师业务繁忙无暇顾及投稿导师对于该论文探讨的领域了解不多其他2 自己投稿前如何跟导师沟通记得询问导师以下几点:有没有课题组人不能投的杂志作者排名相关自己创建账号投稿还是使用导师账号需要挂什么基金号有没有推荐审稿人...

2020-01-16 19:58:15 547

原创 mac tmux备忘

mac tmux备忘参考:Linux终端复用神器-Tmux使用梳理会话操作命令操作tmux new -s name新创建一个会话以"name"命名tmux new -s name -d在后台新建会话tmux ls查看已创建会话tmux a -t nameattach 会话 nametmux kill-session -t name关闭会话...

2019-10-23 13:19:45 120

原创 宏基因组分箱后续

宏基因组分箱后续1.分箱流程2.代谢潜能分析2.1代谢通路构建2.2基因簇分析3.进化树构建3.1物种选择3.1.1如何从NCBI批量下载genome数据3.2进化树构建3.2.1序列选择用16S rRNA构建:用保守基因串联构建:3.2.2建树3.2.3进化树美化4.基因草图可视化5.进化历程分析在获得了binning结果之后,下一步应该进行什么分析呢?本文将针对binning之后的分析思路进...

2019-10-05 21:40:24 4558

原创 影响生物进化的主要因素及其熵变规律

影响生物进化的主要因素及其熵变规律1 熵的概念及发展1.1 克劳斯的热力学熵1.2 玻尔兹曼的分子运动熵1.3 Shannon信息熵总结2 生物进化与信息熵2.1 群体遗传学2.2 群体遗传学与熵熵理论,对于整个科学来说是第一法则。 ——爱因斯坦生物为了生存而作的一般斗争,既不是为了物质,也不是为了能量,而是为了熵而斗争。 ——玻尔兹曼新陈代谢中本质的东西,乃是使有机体成功地消除...

2019-09-27 19:28:01 2873

原创 metaWRAP画图报错修正

metaWRAP画图报错修正关于metaWRAP宏基因组分箱流程,可以通过比较多个分箱软件的结果来取最优,最近也有更新,conda可安装,自带kraken物种注释,可以进行重组装,很优秀。安装和使用说明见:github关于bug在进行bin_refinement时,metawrap会绘制bin的完整度(completion)和污染(contamination)的折线图,以此评估各个软件的...

2019-09-15 19:32:08 481

原创 根据sam文件计算reads的GC含量

根据sam文件计算reads的GC含量输入文件DNA序列的sam文件第一列,序列名;第十列,序列;分割 tab目标计算每个read的GC含量(只考虑DNA序列由ATGC组成的情况),并输出结果到文件输出文件第一列read id,第二列read的序列,第三列GC含量def cal_gc(seq): """ 计算GC含量 """ seq = seq.upper() #全部转换为...

2019-09-05 20:50:17 1008

原创 Python数据类型和基本语句

Python入门python数据类型python语句函数类模块禁转python数据类型空值:None整型:16; 0b10000(二进制); 0x10(十六进制)浮点型:0.1; 1e-1字符型:‘hello’; “hello”; ‘’‘hello’’’; “”“hello”""布尔型:True; False列表:[1,‘a’,True,[1,2,3]](元素可以是任意类型)元组...

2019-09-05 19:58:52 123

原创 简单欧氏距离分类器

简单近朱者赤分类器基本概念人工智能机器学习深度学习机器学习问题描述机器学习分类监督学习无监督学习任务水果识别数据集描述思路代码实现基本概念人工智能机器学习实现人工智能的一种方法深度学习机器学习中的一类算法特点:大数据,效果好,图像识别,语音识别机器学习问题描述“学习”问题通常包括n个样本数据(训练样本)每个样本包含的多个属性(多维数据)被称为“特征”通过特定的算法从训练样本...

2019-08-29 13:58:51 2279

原创 基因表达调控

基因表达调控基因表达特点基因表达方式基因表达调控基因表达调控的基因原理基因表达的多级调控顺式作用和反式作用激活基因转录的基本要素根据张涛、裴秀英主编. 生物化学[M]. 2010 整理,禁转。基因表达就是指在一定调节因素的作用下,DNA分子上特定的基因被激活并转录生成特定的RNA,或进一步翻译成特定蛋白质的过程。基因表达特点时间特异性temporal specificity,指特定基因...

2019-08-15 17:12:21 1180

原创 群体表观遗传差异

群体表观遗传差异本文为文献阅读笔记,以下内容有个人理解,可能和原文有出入,未经允许,禁转载。文献:Genetic source of population epigenomic variationNature Reviews Genetics 2016 影响因子15+用chromatin state maps定义表观基因组chromatin state maps:计算上整合了不同表...

2019-08-14 18:25:28 1277

原创 宏基因组分析流程报错与解决

MetaPhlAn_Pipelines_Tutorial是进行宏基因组物种组成分析的流程,详细的流程参考:https://bitbucket.org/nsegata/metaphlan/wiki/MetaPhlAn_Pipelines_Tutorial在运行流程中step4进行lefse分析时,运行plot_res.py脚本会报错,报错内容:Traceback (most recent cal...

2019-06-19 14:10:29 2851 1

原创 宏基因组有参分析和无参分析差异

宏基因组有参分析和无参分析差异分析流程解决问题结果差异本文参考宏基因组教程Metagenomics Tutorial (HUMAnN2) 分析流程有参流程:质控–物种组成和功能组成分析–差异分析及可视化无参流程:质控–物种分类–序列拼接–基因注释–去冗余–基因定量–功能注释–差异分析及可视化注:无参分析需要非常大的比对数据库,所以服务器配置最低256G内存,推荐内存512G以上,以保...

2019-06-15 18:06:42 3660

转载 流平衡分析(FBA)

流平衡分析(FBA)Flux Balance Analysis本文参考流平衡分析简介流 (flux)流就是代谢网络中化学反应的反应速率在稳态下,各代谢物浓度不变,反应速率满足一定的分布(流分布)分子类型转化流指单位时间内的转化量平衡平衡就是约束约束来自两个方面:基本物理规律的约束,物质不灭,能量守恒等边界条件的约束,底物的供应量(上限),产物的生成量(下限)等因此流平衡...

2019-06-10 20:42:04 5926 1

原创 Bogotá河微生物群落代谢网络重构

Metagenome level metabolic network reconstruction analysis reveals the microbiome in the Bogotá River is functionally close to the microbiome in produced waterEcological Modelling 2019 2.5Universid...

2019-06-10 16:07:10 491

原创 代谢依赖驱动微生物共存

Metabolic dependencies drive species co-occurrence in diverse microbial communitiesPNAS 2015 9+European Molecular Biology LaboratoryPoints:使用了800 communities进行ModelSEED pipeline得到resource competit...

2019-06-10 13:12:43 931

原创 Perl进阶

Perl进阶子程序sub编写命令行参数传递打印使用帮助perl调用系统命令perl中使用第三方包路径处理包Getopt::Long传递参数子程序sub编写子程序声明sub子程序可以传入数组/哈希默认变量@_ 用于传递参数子程序调用&变量的作用域:子程序中定义的变量作用域只能在子程序中调用,子程序可以调用全局变量返回值returnPerl 子程序(函数)#子程序示例...

2019-06-06 20:55:34 860

原创 根据id提取fasta序列

Perl脚本练习bioperl读入写出fasta要求根据序列ID,从fasta文件中提取目标序列并输出数据序列IDfasta文件思路以序列ID为键,构建哈希用bioperl读入fasta,获得序列id如果id存在于哈希中,输出序列代码die "perl $0 <id> <fa> <OUT>" unless(@ARGV==3);#$...

2019-06-05 14:41:58 5281

原创 Bioperl使用

Bioperl使用测序文件读入写出序列截取反向互补序列蛋白质翻译测序文件读入写出use Bio::SeqIO;use Bio::Seq;use Data::Dumper;#fasta$in = Bio::SeqIO->new(-file => "D:/test.fa", -format => 'Fasta', -alphabet =>"dna");$out ...

2019-06-05 14:05:52 2345

原创 gff数据处理

Perl脚本练习通过数组和哈希引用读取存储复杂数据要求gff文件,记录每个基因的名称、起始终止位置、染色体、转录本信息数据#注释行分割:\t9列:gff格式 思路构建一个哈希,结构my%gene = ( geneID => { 'location' => [chrs, start, end] 'transcripts' => [ { ...

2019-06-04 20:21:17 3963 1

原创 正则表达式

正则表达式通配符表达式描述.匹配除换行符以外的所有字符x?匹配0次/1次x字符串x*x匹配>=0次x+x匹配>=1次*任何字符匹配>=0次.+任何字符匹配>=1次{m}指定字符串匹配=m次{m,n}指定字符串匹配>=m 并<=n次{m,}指定字符串匹配>=m次[...

2019-06-04 15:16:24 168

原创 统计不同表达量区间的基因数量

Perl脚本练习要求统计每个样本不同表达量区间的基因数量数据表达矩阵思路初始化一个哈希,用于计数表达矩阵的一列为一个样本,对每列每个基因的表达量进行判断,并计数代码open(IN, "D:/exp.txt") || die "$!";open(OUT, ">D:/out.txt") || die "$!";my %stat =( "0.5-5"=>0,...

2019-06-03 21:22:05 1295

原创 提取一个数据的子集

perl脚本练习要求根据提供的ID,提取一个数据的子集输出到一个新的文件数据表达矩阵目标基因ID思路目标基因按行循环读取,获得一个哈希,基因名为键表达矩阵按行读取,提取基因名,判断是否存在哈希的键中,如果存在就输出这一行,没有就跳过代码open(IN, "D:/exp.txt") || die "$!";open(INID, "D:/id.txt") || die "...

2019-06-03 20:58:57 893

原创 eclipse生信编程环境搭建

eclipse环境搭建Eclipse IDE for Eclipse Committers用于代码测试编辑优点:开源,集成参考:组学大课题java配置eclipse需要java环境windows的java配置方法java查看java -versionwhere javaeclipse配置perl安装perl插件EPIC:help-eclipse marketplace-...

2019-05-31 19:57:13 269

原创 Perl入门

简介时间:Larry Wall 1987Practical Extraction and Reporting Languageperl第三方包网站学习书籍:Perl 语言入门(小骆驼)生信领域需要对perl进行学习

2019-05-31 18:54:08 3249 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除