生信在线工具(转载)

Web服务器名称网址简要描述;简介
agriGO v2http://systemsbiology.cau.edu.cn/agriGOv2/GO分析农业物种
AMMOS2http://drugmod.rpbs.univ-paris-diderot.fr/ammosHome.php能量最小化蛋白质 - 配体复合物
antiSMASHhttp://antismash.secondarymetabolites.org/细菌和真菌基因组中的次级代谢物生物合成基因簇挖掘
ARTShttp://arts.ziemertlab.com新型抗生素的生物合成基因簇挖掘
BAR 3.0http://bar.biocomp.unibo.it/bar3蛋白质结构和功能注释
BepiPred-2.0http://www.cbs.dtu.dk/services/BepiPred-2.0/来自蛋白质序列的B细胞表位预测
BioAtlashttp://bioatlas.compbio.sdu.dk微生物组和宏基因组位置的可视化
BIS2Analyzerhttp://www.lcqb.upmc.fr/BIS2Analyzer/分析蛋白质序列中的共同氨基酸对
大忙人https://ccb-microbe.cs.uni-saarland.de/busybee宏基因组合
咖啡店https://github.com/younglululu/CAFE独立程序,用于无对齐的宏基因组数据比较
癌症PanorOmicshttp://panoromics.irbbarcelona.org将癌症突变定位到3D蛋白质 - 蛋白质相互作用位点
http://zhanglab.ccmb.med.umich.edu/COFACTOR/基于结构的蛋白质功能注释
complex查看http://xvis.genzentrum.lmu.de/compleXView基于亲和纯化质谱的蛋白质 - 蛋白质相互作用
ConTra v3http://bioit2.irc.ugent.be/contra/v3转录因子结合位点分析
CPC2http://cpc2.cbi.pku.edu.cn蛋白质编码RNA转录本的潜力
CSPADEhttp://cspade.fimm.fi/化学信息学生物活性测定可视化
CSTEEhttp://comp-sysbio.org/cstea/分析细胞状态转换的时间序列基因表达数据
DEOGEN2http://deogen2.mutaframe.com/预测蛋白质中的有害突变
DNAproDBhttp://dnaprodb.usc.eduDNA-蛋白质复合物的结构分析
DSSRhttp://jmol.x3dna.orgDNA和RNA结构可视化
DynOmicshttp://dyn.life.nthu.edu.tw/oENM/蛋白质分子动力学使用弹性网络模型
EBISearchhttp://www.ebi.ac.uk/ebisearchWeb服务文本在EMBL-EBI数据中搜索
FireProthttp://loschmidt.chemi.muni.cz/fireprot耐热蛋白质的设计
GalaxyHomomerhttp://galaxy.seoklab.org/cgi-bin/submit.cgi?type=HOMOMER预测蛋白质同源寡聚体结构
GASS WEBhttp://gass.unifei.edu.br/鉴定酶活性位点
宝石http://gemstone.yulab.org/人类疾病中的遗传变异优先排序
基因ORGANizerhttp://geneorganizer.huji.ac.il人类基因与受影响的身体器官的联系
GenProBiShttp://genprobis.insilab.org将SNP定位到蛋白质结合位点
GEPIAhttp://gepia.cancer-pku.cn/癌症中差异基因表达的分析
GeSeqhttps://chlorobox.mpimp-golm.mpg.de/geseq.html叶绿体基因组的注释
GibbsClusterhttp://www.cbs.dtu.dk/services/GibbsCluster-2.0检测蛋白质短线性基序
GPCR SSFE 2.0http://www.ssfa-7tmr.de/ssfe2/G蛋白偶联受体的同源建模
GWABhttp://www.inetbio.org/gwab/基于网络的全基因组关联分析
HDOCKhttp://hdock.phys.hust.edu.cn/蛋白质 - 蛋白质和蛋白质 - DNA / RNA对接
HVGAhttp://bioinfodev.hpc.cam.ac.uk/web-apps/hgva存档人类遗传变异注释
HH-主题http://chimborazo.biochem.mpg.de/检测蛋白质短线性基序
I-TASSER-MRhttp://zhanglab.ccmb.med.umich.edu/I-TASSER-MR/用于X射线晶体学的蛋白质结构建模
附加http://bioinfo.uochb.cas.cz/INTAA/氨基酸相互作用能的分析
IntaRNA 2.0http://rna.informatik.uni-freiburg.de/IntaRNA/Input.jsp预测RNA分子之间的相互作用
IslandViewer 4.0http://www.pathogenomics.sfu.ca/islandviewer4/细菌基因组岛的预测(水平基因转移)
kpLogohttp://kplogo.wi.mit.edu/短序列图案的检测和可视化
LigParGenhttp://jorgensenresearch.com/ligpargen用于分子动力学的力场参数
LimToxhttp://limtox.bioinfo.cnio.es文本挖掘复合毒性
MCSM-NAhttp://structure.bioc.cam.ac.uk/mcsm_na预测蛋白质突变对核酸结合亲和力的影响
MicrobiomeAnalysthttp://microbiomeanalyst.ca微生物组数据分析
MinePathhttp://www.minepath.org监管网络子路径的差异表达分析
ModFOLD6http://www.reading.ac.uk/bioinf/ModFOLD/蛋白质结构质量评估
mTCTScanhttp://jjwanglab.org/mTCTScan癌症药物反应的突变优先排序
MutaGenehttps://www.ncbi.nlm.nih.gov/projects/mutagene/癌症突变谱的可视化和分析
NNAlign-2.0http://www.cbs.dtu.dk/services/NNAlign-2.0检测受体 - 配体相互作用的配体基序
Norevhttp://server.idrb.cqu.edu.cn/noreva/基于质谱的代谢组学数据的数据归一化方法的评估
http://www.hpi.de/plattner/oleloPubMed中的文本挖掘
OmicSeqhttp://www.omicseq.org在主要存储库中搜索组学数据
P4Phttp://sing.ei.uvigo.es/p4p基于肽数据集的细菌菌株分类
Fthviavhttp://pathview.uncc.edu/代谢途径的可视化和注释
pepATTRACThttp://bioserv.rpbs.univ-paris-diderot.fr/services/pepATTRACT预测蛋白质 - 肽对接
Fhrmnapperhttp://lilab.ecust.edu.cn/pharmmapper使用药效团图谱进行药物靶标搜索
PHD-SNPghttp://snps.biofold.org/phd-snpg有害的SNP分类
PIGSProhttp://cassandra.med.uniroma1.it/AbPrediction/web/pigs.php免疫球蛋白可变结构域的建模
plantiSMASHhttp://plantismash.secondarymetabolites.org检测植物中的生物合成基因簇
PMUThttp://mmb.irbbarcelona.org/PMut/预测蛋白质突变的疾病潜力
Prism3http://prism3.magarveylab.ca/prism从生物合成基因簇预测天然产物结构
ProteinsAPIhttp://www.ebi.ac.uk/proteins/api来自UniProtKB的蛋白质数据的Web服务
ProteinsPlushttp://proteins.plus基于结构的蛋白质建模
ProteoSignhttp://bioinformatics.med.uoc.gr/ProteoSign蛋白质差异丰度分析
复性http://www.reading.ac.uk/bioinf/ReFOLD/蛋白质结构细化
RegulatorTrailhttps://regulatortrail.bioinf.uni-sb.de分析转录因子和靶基因
RiPPMinerhttp://www.nii.ac.in/rippminer.html预测核糖体合成和翻译后修饰的肽的化学结构
RNA工作台https://github.com/bgruening/galaxy-rna-workbench用于分析RNAseq和RNA序列数据的独立工具集合
RNA-MoIP业务http://rnamoip.cs.mcgill.ca/RNA 2D和3D结构的预测
SBSPKSv2http://www.nii.ac.in/sbspks2.html聚酮合酶的分析
风景http://mensxmachina.org/en/software/从细胞计数数据重建网络
SDMhttp://structure.bioc.cam.ac.uk/sdm2预测蛋白质突变体的稳定性
http://www.pharmaceutical-bioinformatics.de/sempi/从生物合成基因簇预测聚酮化合物合成酶产物
SLiMSearchhttp://slim.ucd.ie/slimsearch/检测蛋白质短线性基序
苏打http://protein.bio.unipd.it/soda/预测蛋白质突变体中的溶解度
SpartaABChttp://spartaabc.tau.ac.il/webserver使用indel进行序列模拟
ThreaDomExhttp://zhanglab.ccmb.med.umich.edu/ThreaDomEx预测蛋白质结构域和结构域边界
EMBL-EBI的工具http://www.ebi.ac.uk/Tools/webservices/EMBL-EBI的Web服务工具
TraitRateProphttp://traitrate.tau.ac.il/prop序列进化测试与表型的关联
TRAPPhttp://trapp.h-its.org分析蛋白质结合位点动力学
VCF.Filterhttps://biomedical-sequencing.at/VCFFilter/用于过滤和注释vcf文件中的遗传变体的独立程序
Web3DMolhttp://web3dmol.duapp.com/蛋白质结构可视化
WebGestalthttp://www.webgestalt.org基因集功能丰富分析
Wopperhttp://WoPPER.ba.itb.cnr.it/检测具有协调基因表达变化的细菌基因组区域
XSuLThttp://structure.bioc.cam.ac.uk/xsult蛋白质多序列比对的注释和可视化

2018生信在线工具:

Web服务器名称网址简要描述;简介
IPhone Profailerhttp://ekhidna2.biocenter.helsinki.fi/AAI蛋白质组平均氨基酸同一性比较
AlloFinderhttp://mdl.shsmu.edu.cn/ALF/变构调制器识别
ArDockhttp://ardock.ibcp.fr蛋白质 - 蛋白质相互作用区域
BAGEL4http://bagel4.molgenrug.nl次级代谢物基因簇(RIPPs,细菌素)
BAMMhttps://bammmotif.mpibpc.mpg.de核苷酸结合基序
BeStSelhttp://bestsel.elte.hu基于圆二色光谱的蛋白质二级结构分析
BRepertoirehttp://mabra.biomed.kcl.ac.uk/BRepertoire抗体库分析
浏览http://busca.biocomp.unibo.it蛋白质亚细胞定位预测
CABS-flex 2.0http://biocomp.chem.uw.edu.pl/CABSflex2模拟蛋白质结构的灵活性
CalFitterhttps://loschmidt.chemi.muni.cz/calfitter/蛋白质热变性分析
CASTp 3.0http://sts.bioe.uic.edu/castp/蛋白质口袋,空腔和通道的拓扑结构
CavityPlushttp://www.pkumdl.cn/cavityplus蛋白质结合位点腔
CellAtlasSearchhttp://www.cellatlassearch.com单细胞基因表达数据搜索
cgDNAwebhttp://cgDNAweb.epfl.ch双链DNA粗粒模型
CircadiOmicshttp://circadiomics.ics.uci.edu昼夜节律数据集分析和存储库
COACH-dhttp://yanglab.nankai.edu.cn/COACH-D/蛋白质 - 配体结合位点预测
Coloc-统计https://hyperbrowser.uio.no/coloc-stats/基因组位置富集分析
ComplexContacthttp://raptorx2.uchicago.edu/ComplexContact/蛋白质异二聚体复合残基 - 残基接触预测
Conekt公司的植物http://conekt.plant.tools植物基因共表达的比较分析
CRISPORhttp://crispor.orgCRISPR / Cas9基因组编辑的指导序列
CRISPRCasFinderhttps://crisprcas.i2bc.paris-saclay.frCRISPR阵列和Cas基因检测
CSAR-网http://genome.cs.nthu.edu.tw/CSAR-web重叠群脚手架
dbCAN2http://cys.bios.niu.edu/dbCAN2碳水化合物活性酶注释
DynaMuthttp://biosig.unimelb.edu.au/dynamut/点突变对蛋白质稳定性和动力学的影响
easyFRAP的Webhttps://easyfrap.vmnet.upatras.gr/蛋白质迁移率分析与光漂白数据后的荧光恢复
EviNethttps://www.evinet.org/基因集网络丰富分析
ezTaghttp://eztag.bioqrator.org生物医学概念注释
FragFithttp://proteinformatics.de/FragFit低温EM密度图的蛋白质区段建模
弗赖堡RNA工具http://rna.informatik.uni-freiburg.deRNA分析
GADGEThttp://gadget.biosci.gatech.edu基于人群的遗传变异分布
星系https://usegalaxy.org生物医学数据分析工作流程
Galaxy HiCExplorerhttps://hicexplorer.usegalaxy.eu染色质三维​​构象分析
GDAhttp://gda.unimore.it/整合药物反应,基因表达谱和癌症突变
基因疯狂http://genemania.org基因功能预测
geno2pheno [NGS-频率]http://ngs.geno2pheno.org病毒耐药性预测
GIANT 2.0http://giant-v2.princeton.edu人体组织特异性基因功能关系
GPCRMhttp://gpcrm.biomodellab.eu/G蛋白偶联受体结构建模
喜剧http://grinn.readthedocs.io蛋白质分子动力学残基相互作用能
GWAS4Dhttp://mulinlab.org/gwas4d从GWAS数据中确定监管变体的优先次序
HMMERhttp://www.ebi.ac.uk/Tools/hmmer配置文件隐藏马尔可夫模型同源搜索
HotSpot向导3.0http://loschmidt.chemi.muni.cz/hotspotwizard3蛋白质工程定向突变
HPEPDOCKhttp://huanglab.phys.hust.edu.cn/hpepdock/肽 - 蛋白质对接
HSYMDOCKhttp://huanglab.phys.hust.edu.cn/hsymdock/对称蛋白质复合物对接
InterEvDock2http://bioserv.rpbs.univ-paris-diderot.fr/services/InterEvDock2/蛋白质 - 蛋白质对接
INTERSPIAhttp://bioinfo.konkuk.ac.kr/INTERSPIA/多种蛋白质 - 蛋白质相互作用
Ifth3k0http://pathways.embl.de代谢途径可视化和定制
IUPred2Ahttp://iupred2a.elte.hu本质上无序的蛋白质区域
k无活性http://biosig.unimelb.edu.au/kinact/激酶激活错义突变预测
KnotGenomehttp://knotgenom.cent.uw.edu.pl/染色体结和拓扑的拓扑分析
LitVarhttps://www.ncbi.nlm.nih.gov/CBBresearch/Lu/Demo/LitVarPubMed的遗传变异信息检索
这个URLhttp://lolaweb.databio.org基因组区域富集分析
MetaboAnalyst 4.0http://metaboanalyst.ca代谢组学数据分析
MetExplorehttps://metexplore.toulouse.inra.fr/metexplore2/代谢网络分析
多边投资担保机构http://microbial-genomes.org/原核基因组和宏基因组分类
MISTIC2https://mistic2.leloir.org.ar蛋白质家族中的残基对共变
MOLEonlinehttps://mole.upol.cz生物分子通道,隧道和毛孔
MTM-对齐http://yanglab.nankai.edu.cn/mTM-align/蛋白质结构多重比对和数据库搜索
飞龙http://mutalisk.org体细胞突变与基因组,转录和表观基因组特征相关
海洋基因图集http://tara-oceans.mio.osupytheas.fr/ocean-gene-atlas/海洋浮游生物基因地理定位和丰度
oli2gohttp://oli2go.ait.ac.at/用于非人DNA的PCR引物和杂交探针设计
OmicsNethttp://www.omicsnet.ca分子相互作用网络可视
oriTfinderhttp://bioinfo-mml.sjtu.edu.cn/oriTfinder细菌移动遗传元件中转移位点的起源
PaintOmics 3http://bioinfo.cipf.es/paintomics/KEGG途径的组学数据的可视化
PANNZER2http://ekhidna2.biocenter.helsinki.fi/sanspanz/蛋白质功能预测
PatScanUIhttps://patscan.secondarymetabolites.org/DNA和蛋白质序列模式搜索
PhytoNethttp://www.gene2function.de浮游植物基因表达谱
pirScanhttp://cosbi4.ee.ncku.edu.tw/pirScan/piRNA目标预测
原卟啉原-IIhttp://tox.charite.de/protox_II化学毒性预测
psRNATargethttp://plantgrn.noble.org/psRNATarget/植物小RNA目标预测
PSSMSearchhttp://slim.ucd.ie/pssmsearch/用于结合和翻译后修饰的蛋白质基序
哈巴狗RESThttps://pubchemdocs.ncbi.nlm.nih.gov/pug-restPubChem cheminformatics程序化访问
RepeatsDB - 精简版http://protein.bio.unipd.it/repeatsdb-lite蛋白质中的串联重复
RNApdbee 2.0http://lepus.cs.put.poznan.pl/rnapdbee-2.0/RNA二级结构注释
RSAThttp://www.rsat.eu/DNA调控基序
SMARTIVhttp://smartiv.technion.ac.il/RNA结合蛋白的RNA序列和结构基序
SNPnexushttp://www.snp-nexus.orgSNP功能注释
SAVEhttps://www.lisanwanglab.org/SPAR小RNA测序数据的分析
SWISS-MODELhttps://swissmodel.expasy.org蛋白质和蛋白质复合物的结构同源性建模
TAM 2.0http://www.scse.hebut.edu.cn/tam/microRNA集富集分析
TCRmodelhttp://tcrmodel.ibbr.umd.edu/T细胞受体结构建模
UNREShttp://unres-server.chem.ug.edu.pl粗粒度模拟蛋白质结构
VarAFThttp://varaft.eu致病变异注释
WEGO 2.0http://wego.genomics.org.cn基因本体可视化
X2K Webhttp://X2K.cloud差异表达基因特征的激酶富集分析
xiSPEChttp://spectrumviewer.org蛋白质组学质谱数据分析

转载说明:简书.螺旋挖矿
 

<think>嗯,用户想了解息学中gzip压缩工具的使用方法。首先,我需要回忆一下gzip的基本功能和常见参数,确保回答正确。息学中处理的数据通常是大型文件,比如FASTQ、FASTA、SAM/BAM等,所以压缩非常重要,节省存储空间和传输时间。 首先,我应该介绍gzip的基本命令,比如压缩和解压文件。然后,可能需要提到一些常用参数,比如压缩级别、保留原始文件、查看压缩文件内容等。另外,息学中可能涉及管道操作,比如直接压缩输出流,或者与其他工具结合使用,比如结合tar来压缩目录。 还要注意用户提到的引用内容,看看是否有相关引用可以关联。比如引用[3]里提到了处理FASTQ文件的工具,可能可以提到在处理这些文件时使用gzip压缩。同时,用户提供的引用中有关于minimap2和索引的内容,但暂时和gzip关系不大,不过可以提醒用户在处理大文件前压缩以节省空间,可能和引用[1]中提到的索引成前的步骤有关联。 另外,用户可能需要知道如何查看压缩文件内容而不解压,比如使用zcat或gzip -d -c,这在处理日志或检查文件内容时很有用。还要注意解压后是否保留原文件,使用-k参数或者在解压时指定输出文件。 最后,成相关问题,比如与其他压缩工具的比较,或者如何处理压缩文件中的特定格式,比如FASTQ。可能还需要提醒一些注意事项,比如压缩后的文件格式是.gz,以及压缩级别对时间和压缩率的影响。 需要确保所有命令示例正确,比如gzip -d file.gz是否正确,或者是否需要使用gunzip。同时,注意用户可能是在Linux环境下使用,所以命令应符合Linux语法。还要检查是否有错误,比如压缩目录是否需要先用tar打包,因为gzip本身不能压缩目录。 总结一下,回答结构应该是先介绍基本用法,再详细参数,然后息学中的应用场景,结合引用,最后给出相关问题。确保每个步骤清晰,命令正确,并且引用适当的地方,比如在处理FASTQ时使用gzip,可以引用[3]中的相关内容。</think>### Gzip在息学中的使用方法 Gzip是息学中广泛使用的压缩工具,主要用于减少大型物数据文件(如FASTQ、FASTA、VCF等)的存储和传输成本。以下是具体操作指南: --- #### **1. 基础压缩与解压** - **压缩文件** ```bash gzip input.fastq # 成input.fastq.gz,删除原文件 gzip -k input.fastq # 保留原文件(需gzip≥1.6) ``` - **解压文件** ```bash gzip -d input.fastq.gz # 解压为input.fastq gunzip input.fastq.gz # 等效命令 ``` --- #### **2. 常用参数详解** - **指定压缩级别** ```bash gzip -1 input.fastq # 最快压缩(-1到-9,默认-6) gzip -9 input.fastq # 最高压缩率,耗时更长 ``` - **流式压缩/解压** ```bash samtools view -b input.sam | gzip > output.sam.gz # 直接压缩输出流 zcat input.fastq.gz | head -n 4 # 不解压查看文件内容 ``` --- #### **3. 物数据场景应用** - **压缩测序数据** FASTQ文件压缩可节省70-80%空间[^3]: ```bash gzip sample_1.fq # Illumina测序数据压缩 ``` - **与流程工具集成** 许多工具支持直接读取`.gz`文件,如`bwa`、`bowtie2`: ```bash bwa mem ref.fa sample_1.fq.gz sample_2.fq.gz > output.sam ``` --- #### **4. 高级操作技巧** - **多文件批量压缩** ```bash find ./data -name "*.fastq" -exec gzip {} \; # 递归压缩目录下所有FASTQ ``` - **目录打包压缩** ```bash tar -czvf project_data.tar.gz ./raw_data/ # 先打包再压缩(gzip处理单文件) ``` --- #### **注意事项** 1. 压缩后的文件名自动添加`.gz`后缀 2. 默认行为会删除原始文件,建议配合`-k`参数使用 3. 对已压缩文件(如BAM)再次压缩可能增加体积 相关问题
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值