Python与基因
文章平均质量分 54
yhlhhhh
这个作者很懒,什么都没留下…
展开
-
对计算器中位点的Fst进行分析
科普:Fst,群体间分化指数,用于群体间分化分析。取值范围:[0, 1]划分标准:0~0.05:群体间遗传分化很小,可以不考虑;0.05~0.15,群体间存在中等程度的遗传分化;0.15~0.25,群体间遗传分化较大;0.25以上,群体间有很大的遗传分化。在这里,我们以三种计算器:K3,K12b,K47分别代表k数小、中、大的计算器来进行研究计算方法:https://blog.csdn.net/q623928815/article/details/78627610?ops_request_m原创 2022-01-16 00:21:55 · 729 阅读 · 0 评论 -
BioSQL----搭建分子生物学数据库
最近在做一个网站,网站必不可少的当然是数据库。现在可能生物领域的数据库还比较少。。。所以我在CSDN找了很多的资料结果还是不尽如人意。于是乎,我就想到了python里极为强大的一个分子生物学库:biopython。嘿,真别说,官方中文文档里还真出现了这么一个东西----BioSQL。因为BioSQL是需要基于其他数据库来运行,这里我们以MySQL为例首先,传统艺能,打开终端,输入以下命令行创建数据库:mysqladmin -u root -p create 数据库名称然后,我们可以告诉MySQL加原创 2022-01-15 23:48:50 · 1083 阅读 · 0 评论 -
利用Ancol PCA法将祖源计算器结果与实际情况相结合可视化分析
前言看到题目的小伙伴是不是内心有一万个❓是不是想问那个Ancol PCA是什么鬼。不知道正常,因为这词是我造的233333为什么叫这个名字:众所周知血统的英文是Ancestry,位置的英文是location,这俩单词取前三个字母,loc再倒过来去掉c,组合在一起不就是Ancol吗~PCA就是主成分分析的意思不变哦~下面教程正式开始:编程语言:python3.8模块:pandas numpy sklearn matplotlib geopy整体思路:先将计算器的多维数据降为二维数据并使其作为x原创 2021-07-28 17:03:15 · 198 阅读 · 0 评论 -
利用WeGene WGS给出的VCF文件输出类似WeGene芯片数据txt
利用WeGene WGS给出的CRAM文件输出类似WeGene芯片数据txt概述:编程语言:Python3.8模块:pyvcf csv可选:jupyter整体思路:识别WeGene芯片数据txt的文件特征,读取vcf文件并根据其中内容获取所需数据并写入到txt中前排提示:强烈建议买一个读写速度快一点而且至少是128GB或以上的U盘,当然我是直接买了个1T的移动硬盘步骤:通过观察微基因芯片测试txt结果,我们可以得知重要信息分别为:RSID chromosome position ge原创 2021-07-21 21:07:02 · 354 阅读 · 1 评论 -
用Python绘制发育树
用Python绘制发育树概述:编程语言:python3.8模块:biopython可选:jupyter整体思路:绘制发育树本次教程案例:母系单倍群A8a的分化树步骤:在txt上按照 (子支1,子支2)母支 来写txt文档,若需要加上MRCA,格式:(子支1:MRCA1,子支2:MRCA2)母支:MRCA3以newick格式读取该txt文件,并使用common_ancestor().color语句设置颜色。这里我是按照地理分布分别标记颜色。不过比较郁闷的是没法设置图例。原创 2021-06-24 16:42:48 · 731 阅读 · 1 评论 -
利用Python读取fasta文件并进行一系列操作(三)
利用Python读取fasta文件并进行一系列操作(三)概述:本节目标:计算智人与猩猩ABO基因的相对熵语言:python3.8模块:pysam, scipy整体思路:先计算出序列中“AG”“CT”“AC”“AT”“GC”“GT”六种组合序列所占比,再计算相对熵步骤:利用pysam模块分别读取智人ABO基因所有序列和猩猩ABO基因所有序列import pysam as samfrom scipy import statshfasta = sam.FastaFile('homo_原创 2021-06-23 16:39:16 · 936 阅读 · 0 评论