![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
生物信息
生信分析软件
name_qgy
这个作者很懒,什么都没留下…
展开
-
配置网页版R(RStudio Server)
在做生信分析项目,比如转录组、单细胞时,先在服务器中运行一系列的生信软件对下机数据进行质控过滤等流程,再用R进行数据挖掘。如果质控后的数据传到自己的电脑上用R分析,一是翻来覆去比较麻烦,二是个人电脑配置不足会影响分析的效率甚至于分析不了。为了解决上述问题,可以在服务器中配置R的在线环境,通过浏览器连接到服务器的R,再进行后续分析。如何配置一个在线的R环境,以通过服务器ip地址和8787端口连接呢,大体分为5步,分别是1.新建普通用户,2.安装R,3.安装RStudio,4.开启8787端口,5.登录。原创 2023-03-17 15:20:13 · 5451 阅读 · 3 评论 -
从NCBI批量下载数据
NCBI下载文献中提到的数据时,都会遇到数据较多,下载较慢的问题,本文提供了一个shell脚本可以批量化下载数据,提高工作效率。比如说,有一个Project号为PRJNA229998,GEO号为GSE52778的项目(转录组数据既有Project号也有GEO号,两者对应的同一个项目),该项目测了哮喘病人服用两种药后气道平滑肌的转录组,网址为,我想要下载服用Alb这种药和对照组为服药的转录组数据,大体分为三步走,一是拿到SRA号,二是筛选想要的SRA号,三是下载。原创 2023-03-13 18:37:52 · 2984 阅读 · 0 评论 -
利用Python查找参考序列中有几个motif
利用Python查找参考序列有几个motif原创 2022-10-01 11:30:03 · 709 阅读 · 0 评论 -
基因家族特征分析 - 染色体定位分析
染色体定位分析是将基因家族成员在染色体上的位置标注出来,观察基因家族成员在染色体上是否成簇分布。原创 2022-06-29 10:57:01 · 13743 阅读 · 3 评论 -
如何向NCBI上传线粒体基因组序列
如何向NCBI上传线粒体基因组序列进入Banklt主页https://www.ncbi.nlm.nih.gov/WebSub/?form=history&session=new&tool=genbank点击Start Banklt Submission填写个人联系方式邮箱最好填写学校或者单位邮箱,qq、163邮箱存在接收不到NCBI工作人员通知的可能。自上至下,依次是填写序列作者信息,文章未发表的话填写文章草拟的标题,已接收或已发表就写文章标题,作者都有谁原创 2022-04-11 20:40:35 · 3797 阅读 · 1 评论 -
利用VARNA来画tRNA的二级结构
1 tRNA的结构与功能 转运RNA(Transfer RNA),简称为tRNA,是由70~90个核苷酸组成的单链,tRNA的一级结构就是核苷酸的排列顺序,通过折叠形成二级结构,三叶草状。它是在细胞核中一小部分DNA上合成的,罗伯特·W·霍利在1965年提出了tRNA的三叶草模型,三叶草有三个褶皱,四个臂,即反密码子臂(anticodon arm),D臂(d arm),TΨC臂(tc arm)和氨基酸受体臂(amino acid acceptor arm)。除了这四个臂,还有一个可变臂(variable原创 2022-03-04 21:23:01 · 4443 阅读 · 1 评论 -
利用MTviz绘制线粒体基因组结构图
MTviz是专门绘制线粒体基因组结构图的在线绘图软件,官方网址如下:http://pacosy.informatik.uni-leipzig.de/mtviz/。1 软件功能绘制成环的线粒体基因组结构图;基因名称根据其可用的空间自动调整大小,保证比例的协调;从Genbank格式的文件中读取并修改数据;导出为eps、ps、pdf、png、jpg等矢量图格式,后续可以利用Ai软件进行修改;可以对线粒体基因组的细节进行微调;可以选择合适的字体、字体颜色以及背景颜色等。2 操作步骤上传g原创 2022-03-03 21:32:08 · 3583 阅读 · 5 评论 -
利用MEGA计算π值和Ka/Ks
π值的计算将之前比好的序列并保存为.mas格式的文件拖拽到MEGA里,选择analysis。计算Π值,需要使用CDS序列,选择yes。选择DISTANCE -> Compute Pairwise Distances将参数设置为上图所示,选择JC校正模型。即可得到上图所示的结果,每个单元格中的值即为π值,该值介于0~1之间,该值越趋近于0,代表着该单元格对应的两条序列之间的核苷酸差异越小。若单元格中的值超过1,说明该单元格对应的两条序列的核苷酸差异已经大于它们自身的原创 2022-01-20 23:52:56 · 5086 阅读 · 1 评论 -
利用MEGA做序列比对
利用MEGA做序列比对MEGA是Molecular Evolutionary Genetics Analysis的英文简称,MEGA是一款功能强大、操作简单,图形化界面的应用于分子进化遗传学分析的软件。1993年,MEGA首次发布,2021年7月,马上到而立之年的MEGA发布了第11版,也是目前(2022年1月)的最新版本。下载安装进入官网(https://www.megasoftware.net/)对于Windows 64位 用户,按照官网的默认选项下载图形化界面(GUI)即可。序列比对原创 2022-01-18 23:55:18 · 13274 阅读 · 1 评论 -
Flye | 针对三代测序数据的基因组组装软件
Flye Flye是针对三代测序数据开发的基因组de novo组装的生信软件,于2019年发表在Nature Biotechnology上。1. 软件安装#利用conda安装conda install flye#编译安装git clone https://github.com/fenderglass/Flye cd Flyepython setup.py installflye --help#输入上述命令查看是否成功安装,以下为该命令运行结果的一部分。usage: flye (原创 2021-12-29 20:09:24 · 3812 阅读 · 0 评论 -
生物信息学名词解释 | K-mer (长度为k的短序列)
K-mer何谓K-mer所谓Kmer,即为一段长度为k的DNA片段,是由测序reads剪切一部分得到的。k为一个奇数,k=几,就为几mer。比如:我的测序reads长度为100bp,我将这100bp打断成17bp的短片段,打断后的17bp段片段就叫17mer,可以获得(100-17+1)条k-mer序列。Table1 k-mers for GTAGAGCTGT.kk-mers1G,T,A,G,A,G,C,T,G,T3GTA,TAG,AGA,GAG,AGC,GCT,CT原创 2021-12-27 16:42:46 · 19672 阅读 · 2 评论 -
python | 计算数值文本某一列最小值,将该列原数值加上该最小值
在用dn,ds计算w值时,如果ds(分母)的值为0,那就没法计算了,现在想通过将所有ds值加上大于0的最小值,作为新的ds值,可以通过下面的python脚本实现。该脚本为一个传参脚本,需要在cmd下运行,格式如下:python ds.py --input xx.txt --output xx.txt--input 为输入文件的路径与文件名--output 为输出文件的路径与文件名原代码:import argparseparser = argparse.ArgumentParser(desc原创 2021-11-24 21:40:48 · 783 阅读 · 0 评论 -
Linux | awk命令查找文件中某列的值,符合内容进行筛选
awk是Linux自带的文件内容筛选工具,awk可以对文件内容进行切片输出,提取出我们想要的内容。awk使用格式:awk [option] ‘条件{print ${num}}’ 。现在我想将上图所示的.gtf文件中的第一、四、五、十列提出出来,要求第三列的值必须为“transcript”,可以通过awk命令实现。cat Female.merge.gtf | awk '$3=="transcript"{printf $1 "\t" $4 "\t" $5 "\t" $10"\n" }'> Tden原创 2021-11-22 18:33:23 · 6961 阅读 · 0 评论 -
HiC-Pro | HiC数据处理工具
一、HiC-ProHiC-Pro官网https://github.com/nservant/HiC-Pro下载软件包git clone https://github.com/nservant/HiC-Pro.git利用conda配置软件运行环境conda env create -n hicpro -f /gss1/home/tri01/software/HiC-Pro/environment.ymlHiC-Pro的编译安装修改config-install.txt和con原创 2021-10-22 16:59:51 · 3804 阅读 · 1 评论 -
PAML|计算dN/dS值的生信软件
PAML是什么PAML是利用最大似然法对CDS或PEP序列进行系统发育分析的生信软件。PAML官方网址:http://abacus.gene.ucl.ac.uk/software/paml.htmlPAML的下载安装wget http://abacus.gene.ucl.ac.uk/software/paml4.9i.tgztar zxf paml4.9i.tgzrm bin/*cd srcmake -f Makefilecp baseml basemlg chi2 codeml.原创 2021-10-02 10:00:17 · 2670 阅读 · 1 评论 -
IQtree|构建进化树的软件
1.IQtree是什么2.IQtree下载安装conda create -n iqtreeconda activate iqtreeconda install iqtree3.IQtree的运行iqtree -s input_file -nt 10 -o ma原创 2021-09-25 21:38:04 · 6045 阅读 · 2 评论 -
Pal2Nal|如何在命令行下运行Pal2Nal
1.pal2nal是什么 pal2nal是一个将已经比对好的蛋白及其对应的DNA(mRNA)多序列转化为密码子比对的程序。 pal2nal的官方说明链接:http://www.bork.embl.de/pal2nal/2.pal2nal的下载安装conda create -n pal2nalconda activate pal2nalconda install pal2nal...原创 2021-09-18 10:38:13 · 2239 阅读 · 0 评论 -
Python|将CDS序列转为PEP序列
有蛋白编码基因的核苷酸序列,想要转化成对应的氨基酸序列,可以利用Python的Biopython Module来实现。提取核苷酸序列信息 原始的保存着核苷酸序列的fasta文件里还有着序列的id等说明信息,我们只需要核苷酸序列,可以用for循环遍历每一行,将偶数行输出到一个新的文本文档中。# opening the filefile1 = open('D:/.../PCGs/cytb/cytb.fas', 'r')# creating another file to store eve原创 2021-09-17 21:48:16 · 1715 阅读 · 3 评论 -
HiCPlotter|HiC数据可视化工具
HiCPlotter简介 HiCPlotter基于Python开发的将HiC数据可视化的工具。官方网站链接如下:https://github.com/kcakdemir/HiCPlotter利用conda搭建HiCPlotter的环境conda create -n hicplotterconda activate hicplotter HiCPlotter的环境依赖1.Python 2.7.*2.Numpy(1.9.0,1.9.2,1.10.4)3.Scipy(0.14..原创 2021-09-16 21:25:14 · 3610 阅读 · 0 评论 -
Anaconda添加channels
运行conda安装软件,出现下述问题The following packages are not availablm current channels可以通过添加频道尝试解决conda config --show#查看目前安装的conda有哪些频道添加频道conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/conda config --add chann.原创 2021-09-14 11:09:55 · 4758 阅读 · 0 评论 -
dotter|打点法进行序列两两比较软件
1.dotter是什么 dotter是利用打点法进行序列两两比对的可以在Windows操作系统下运行的软件。2.dotter下载链接https://sonnhammer.sbc.su.se/download/software/dotter/old_releases/windotter.zip3.dotter运行win + Rcmdcd /d D:\path\Dotterdotter.exe 1.fas 1.fas4.查看结果 dotter运行结果有三个窗口,通过调整颜色设置的窗原创 2021-09-10 10:09:17 · 911 阅读 · 4 评论 -
mafft|多序列比对工具
1.利用conda安装mafftconda create -n mafftconda install mafft2.进入mafft环境中conda activate mafft3.查看mafft版本号,确认是否安装好了mafft --versionv7.487 (2021/Jul/25)4.运行mafftmafft in.fas > out.fas原创 2021-09-10 09:22:00 · 4794 阅读 · 0 评论 -
利用BioEdit做多序列一致性比对
1.单击菜单栏File,选择Open,打开多序列比对的fasta文件。2.单击菜单栏Alignment,选择Sequence Identity Matrix。3.保存为.txt文件附:软件下载网址:http://www.opdown.com/soft/90589.html原创 2021-09-04 21:48:22 · 5472 阅读 · 0 评论 -
利用tRNAscan-SE做tRNA分析
1.从官网(http://lowelab.ucsc.edu/tRNAscan-SE/)下载tRNAscan-SE wget http://trna.ucsc.edu/software/trnascan-se-2.0.9.tar.gz2.解压gunzip trnascan-se-2.0.9.tar.gztar -vxf trnascan-se-2.0.9.tar.gz原创 2021-08-31 10:50:39 · 2704 阅读 · 1 评论 -
如何卸载用conda命令安装的包
conda list1 列出当前安装的所有包conda remove infernal2 下拉找到想要卸载的包名,比如infernal,输入上述代码,如需确认,再输y即可。原创 2021-08-30 15:19:41 · 14255 阅读 · 0 评论 -
线粒体基因组常见缩写与术语
Abbreviation Full name PCGs Protein-codings genes atp6 ATP synthase F0 subunit 6 atp8 ATP synthase F0 subunit 8 cox1 cytochrome c oxidase subunit Ⅰ cox2 cytochrome c oxidase sub...原创 2021-08-17 20:45:49 · 2251 阅读 · 1 评论 -
geneious for linux|生物信息学分析工具的下载安装
下载地址https://www.geneious.com/download/传输到服务器下载到本地后,通过winscp传输到服务器上。运行该shell脚本sh Geneious_Prime_linux64_with_jre.sh由于我们实验室服务器已经安装过了,后面步骤就不继续走了,安装完成后跟在Windows系统下一样使用。...原创 2021-08-11 10:11:11 · 1457 阅读 · 0 评论 -
MitoZ|Multi-Kmer mode
一、什么情况下运行Multi-Kmer mode 当使用MitoZ的quick mode(–run_mode 2),有一些蛋白质编码基因(PCGs)未找到,可以尝试一下multi-Kmer mode(–run_mode 3)。二、输入文件 在运行该模式前,需要准备好quick mode生成的几个文件作为输入文件,包括:work71.hmmout.fa 或 quickMode.fa,提供的fasta文件中要含有您的样品的正确的线粒体基因组序列。要手动创建一个.txt文件,里面描述了在某条序列上原创 2021-08-05 16:15:42 · 1060 阅读 · 0 评论 -
Cworld|HiC数据的处理软件的下载安装
一、Cworld是什么?Cworld是对HiC数据进行处理分析的一款软件,是基于perl语言开发的。二、安装步骤1.安装克隆使用git clone命令将Cworld下载到服务器上,地址:https://github.com/dekkerlab/cworld-dekker.如果git clone不成功,可先将安装包下载到本地,再通过winSCP传输到服务器上。2.编译安装代码如下:cd cworld-dekkerperl Build.PL./Build./Build install -原创 2021-07-24 22:08:16 · 1495 阅读 · 0 评论 -
MitoZ|动物线粒体基因组组装注释软件
一、MitoZ是什么是基于python3开发的可以自动过滤双端测序的原始数据、mt基因组组装、mt基因组注释以及mt基因组可视化的工具。官方的说明文档地址:https://gitee.com/CHANyp/MitoZ#citation二、MitoZ的安装git clone https://gitee.com/CHANyp/MitoZ.gitcd MitoZ/version_2.4-alphatar -jxvf release_MitoZ_v2.4-alpha.tar.bz2三、运行Mito原创 2021-07-26 19:45:08 · 7713 阅读 · 5 评论