宏基因组学Metagenome-磷循环Pcycle功能基因分析-从分析过程到代码及结果演示-超详细保姆级流程

大背景介绍

生信分析,凡事先看论文,有了论文就有了参考,后续分析就有底了,直接上硬菜开干:

PCycDB: a comprehensive and accurate database for fast analysis of phosphorus cycling genes - PubMed

数据库及部分分析代码github库: 

GitHub - ZengJiaxiong/Phosphorus-cycling-database: This is a comprehensive database for fast and accurately analyzing the phosphorus cycling genes.

 

磷循环基因库介绍Phosphorus-cycling-database (PCyCDB):

磷循环数据库 (PCyCDB),包含 138 个基因家族和 10 个代谢过程。将同源基因添加到数据库中,以降低假阳性率。通过识别已知的模拟基因数据集和模拟细菌群落,对序列相似性搜索工具(如BLAST、USEARCH、DIAMOND)生成的比对结果进行过滤的标准(即身份、命中长度)进行了细化,以获得最佳准确性并进一步减少假阳性和假阴性。在70%的同一性和25个氨基酸的截留点下,准确率、PPV、灵敏度、特异性和NPV分别为99.76%、95.70%、99.94%、99.74%和99.99%。重要的是,编码细胞内磷代谢过程的基因被添加到PCyCDB中,这应该有助于研究人员不仅拓宽对地球化学磷循环的见解,而且扩大对微生物磷代谢的见解。

作者对数据库的介绍:

这是磷循环数据库的新版本(PCycDBv1.1)。在Lidbury博士(英国谢菲尔德大学动植物科学系)的帮助下,我们检索了许多重要的磷循环基因(PCG),包括glpQ(细胞质甘油磷酸二酯磷酸二酯酶)、glpT(甘油-3-)基因磷酸盐通透酶)、ushA(5'-核苷酸酶)、phnD_phosphite(可能的 ABC 转运蛋白亚磷酸盐结合蛋白)、ptxABC(可能的亚磷酸盐转运系统)、htxB(推定的特异性次磷酸盐转运蛋白)、ptxD(NAD:亚磷酸盐氧化还原酶/亚磷酸盐脱氢酶)、htxA (次磷酸盐/2-酮戊二酸双加氧酶)、pbfA(磷酸盐分解因子 A)、pafA(磷酸盐不敏感磷酸单酯酶)、aepXVW、aepP 和 aepS(三种新型 2-氨基乙基磷酸盐转运蛋白)。此外,我们还纳入了在约氏黄杆菌 DSM2064 中鉴定的两个 phoA 基因(碱性磷酸酶)(Fjoh_3187 和 Fjoh_3249)。

基因库直接下载链接,v1.1版:

https://github.com/ZengJiaxiong/Phosphorus-cycling-database/releases/download/untagged-5a0f44fdf33412c5d1d3/id2genemap.txt

https://github.com/ZengJiaxiong/Phosphorus-cycling-database/releases/download/untagged-5a0f44fdf33412c5d1d3/PCycDBv1.1.faa

数据库准备

下载数据库

# 直接克隆整个仓库
git clone https://github.com/ZengJiaxiong/Phosphorus-cycling-database.git

# 下载基因idmaping库
wget -c https://github.com/ZengJiaxiong/Phosphorus-cycling-database/releases/download/untagged-5a0f44fdf33412c5d1d3/id2genemap.txt
wget -c https://github.com/ZengJiaxiong/Phosphorus-cycling-database/releases/download/untagged-5a0f44fdf33412c5d1d3/PCycDBv1.1.faa

### 查看id2genemap文件内容
head id2genemap.txt 
521169598	lysR	COG
260599187	lysR	COG
560158809	lysR	COG
15832950	lysR	COG
296104502	lysR	COG
455738413	lysR	COG
126640099	lysR	COG
71907275	lysR	COG
386742586	lysR	COG
197284247	lysR	COG

### fasta文件内容
head PCycDBv1.1.faa 
>161934.XP_010688184.1 [description=ADE2 ontology=COG0152 source=eggNOG]
MLLQQGLLSNKPAPFFSIKSSLMYSSKFSSSVSLTSVKSNIHPFISCKTSIEAHNSSIKSENLPVHGVSEKIVGVLGGGQLGRMLCQAASELAIKIAILDPSQNCPASSLAYYHMVGSFDDSATVEEFAKRCGVLTVETEHVDVATLDKLEQQGVDCEPKASTIRIIQDKYLQKSHFSRLGIPLPKFMEIDSVESARRAGELFGYPLMIKSKRFAYDGRGNAVAKGEEDLSSAVAALGGYERGLYVEKWAPFVKELAVIVARGRDNSILCYPVVETIHKENICHIVKAPAVVPWKVRKLANDVAHKAVSSLEGAGVFAVELFLTEAGEILLNEVAPRPHNSGHHTIESCYTSQYEQHLRAVVGLPLGDPSMKTTAAIMYNILGEDEGEPGFLLAHEFMRRSLTVPGASVHWYDKSEMKRQRKMGHITIVGSSMGIVEGHLKSLLKQDKTDGAISARVGIIMGSDSDLPVMKDASRILDMFGVEHEVRIVSAHRTPEMMFTYAKSAWERGIQVIIAGAGGAAHLPGMVAALTPVPVIGVPVRGSSIDGLDSLLSIVQMPRGVPVATVAINNATNAGLLAVRMLGVGDSDLKSRMAQYLEDARDEVLVKADRLHKDGWEVYLNT
>159749.K0RBF6 [description=ADE2 ontology=COG0152 source=eggNOG]
GRAAGPDDVPRGPPAQHNDALPRRLRPTLPRDAGRRHVRRRRRGPVADRRGLAPRRVEAQGALVGVRRGDDGDRARGRRRAGGAGEGGGERPAVEQGFWRDVCGCYVSDEYDWMSCNASVLGLGLWPGGKRKTTAKPRDELRGRKQEHFAGHSIPLPPYVNLPSVQSIHDAASRFGLPLMLKSRKGAYDGRGNTVLKSTDDAAVSSALSDLGLTESDLPNDALYAEGWIDFRSEVAVMVVRSTTGETRAYPATTAIQTDSICRVVLVPARNVAPDVRERCESVAMAAVDCLGDGATGVFGVELFLVNKPGGGLDVLLNEVAPRPHNTGHYTQDACAVSQFENHLRAVCGLPLGDTGLVVGAAAMVNVLGAPSGGIEETMKGVNAAMTMPRTSVHWYGKGYRAGRKMGHINVTADSHAELDGPLSKLLAAESIDENVIPEDGRIGTNPLVGVIMGSQSDLPTMSDAVKILKEFGIPHEVDIVSAHRTPEKLMTYSRSAAGRGIQVIIAGAGGAAHLPGMVAAMTPLPVVGVPIKTSTLNGQDSLLSIVQMPRGVPVATVAIGNATNAGLLAVRSLCASRPGLRAKMEEYQLKMKEAVDANSSTLLELGCDEFLSMLPNKNKAVNV
>192875.XP_004363538.1 [description=ADE2 ontology=COG0152 source=eggNOG]
MSTSPSVISASRQSVLQRTLGVLGGGQLGRMMADAAHRLGVRIVVLDPT
  • 79
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 6
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小果运维

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值