自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 资源 (2)
  • 问答 (2)
  • 收藏
  • 关注

原创 英国新冠与变种病毒的传播及传染力融入数学建模的探讨(网页版)

前言首先我想先感谢我的老师以及我的队友,没有他们的辛勤付出,这次数学建模比赛论文估计也写不出来😂🙏另外因为刚刚学习两个月,再加上比赛从开始到结束只有三天时间,所以时间实在是非常紧,所以论文写的也很仓促,即使比赛后又修改了一些,肯定还是不可避免的有些错误,还请各位大佬指正🙏因为是网页版,为方便网友测试程序也会直接放在正文里,可能不是特别严谨,切勿过于较真。问题新冠病毒(SARS-CoV-2)被检测出来后,在传播的过程中,发生了包括Alpha、Delta和Omicron在内的多个变种,它们陆续成为全球传播

2022-05-04 01:38:36 7056 6

原创 MATLAB基本语法速成

MATLAB基本语法速成最近由于马上要参加建模比赛了,但是很多东西还没学到(包括MATLAB)所以这几天恶补一下😂因为本人有python基础,又因为MATLAB语法有很多和python很像,所以整个文章将会通过对比MATLAB与python语法的区别,重点去掌握区别部分来学习。分支语句if语句python# python if...elif...elseif a == 0: print('A')elif b == 1: print('B')else: print('

2022-04-23 14:28:11 1458

原创 整理一波人类的过敏源数据库

数据来源:http://allergen.org/index.php数量:共1058种提取超链接代码:import pandas as pdimport openpyxldf = pd.read_excel('allergen——database.xlsx', header = 0, index_col = 0)d = openpyxl.load_workbook('allergen——database.xlsx').activelink = []for i in range(1, 106

2022-01-17 12:15:28 1367

原创 对计算器中位点的Fst进行分析

科普:Fst,群体间分化指数,用于群体间分化分析。取值范围:[0, 1]划分标准:0~0.05:群体间遗传分化很小,可以不考虑;0.05~0.15,群体间存在中等程度的遗传分化;0.15~0.25,群体间遗传分化较大;0.25以上,群体间有很大的遗传分化。在这里,我们以三种计算器:K3,K12b,K47分别代表k数小、中、大的计算器来进行研究计算方法:https://blog.csdn.net/q623928815/article/details/78627610?ops_request_m

2022-01-16 00:21:55 727

原创 BioSQL----搭建分子生物学数据库

最近在做一个网站,网站必不可少的当然是数据库。现在可能生物领域的数据库还比较少。。。所以我在CSDN找了很多的资料结果还是不尽如人意。于是乎,我就想到了python里极为强大的一个分子生物学库:biopython。嘿,真别说,官方中文文档里还真出现了这么一个东西----BioSQL。因为BioSQL是需要基于其他数据库来运行,这里我们以MySQL为例首先,传统艺能,打开终端,输入以下命令行创建数据库:mysqladmin -u root -p create 数据库名称然后,我们可以告诉MySQL加

2022-01-15 23:48:50 1083

原创 详解AlphaFold生成的PDB文件以及3D打印所需的STL文件

继上篇帖子https://blog.csdn.net/yhlhhhhh/article/details/122507090?utm_source=app&app_version=4.21.0&code=app_1562916241&uLinkId=usr1mkqgl919blen 里写的将预测的模型用3D打印机打印出来,而这其中就涉及到格式转换的问题,但据我所知貌似没有专门的转换工具,所以需要用编程实现。而用编程实现的两个基础就是要知道待转换格式的数据框架和转换格式的数据框架分别是

2022-01-15 11:38:52 1091 1

原创 利用AlphaFold进行蛋白质结构预测

AlphaFold是DeepMind公司下的一个预测蛋白质结构的AI,这个公司下的AI还有我们所熟悉的AlphaGo。它对大部分蛋白质结构的预测与真实结构只差一个原子的宽度,达到了人类利用冷冻电子显微镜等复杂仪器观察预测的水平。该程序利用Python写成。今天我们将利用它的云端Jupyter Notebook根据人的红细胞H抗原的氨基酸序列对人的红细胞H抗原的蛋白结构进行预测。首先先打开NCBI找到相关氨基酸序列,把它copy下来之后打开这个网址: https://colab.research.goo

2022-01-15 10:59:57 3575

原创 聊一聊我的计算机大作业吧~

聊一聊我的计算机大作业吧~前言额,本人并不是计算机相关专业的,python学校也还没讲,只是自学的,所以如果代码有些有槽点的地方,还请大佬们轻喷~(求生欲满满)要求主题:以冬奥为主题,内容积极向上作品形式:Word、PowerPoint、Excel、Photoshop或Python作品介绍简介:这是一个能够爬取新浪网上有关冬奥会新闻并且进行数据分析以及可视化的程序。该程序会在运行时爬取当时新浪网搜索冬奥时的文章题目,并将所有文本进行分词,统计词频,最终根据词频生成一个HTML格式的词云。并且

2021-12-17 16:18:46 573

原创 有关基因的词汇科普贴

最近在看《基因传》时偶然发现书后有一个有关基因的词汇表,作为一个学了与生物相关专业的生化人看了就很激动,于是就分享在社区里,为新人做科普。注意书中有一条有错误,我已经把我认为的正确解释在旁边用括号括起来了。那么,开始吧~等位基因:基因的变异体或代替形式。等位基因通常由突变产生并且会造成表型变异。一个基因可以拥有多个等位基因。级联反应:在一系列连续事件中前面一种事件能激发后面一种事件的反应,其化学修饰为酶促反应以及放大效应。中心法则:在大多数生物体中遗传信息只能从DNA传递给信使RNA,然后再从RNA传递

2021-09-08 22:56:31 576

原创 Markdown基本语法科普

目标:了解markdown的基本语法(日常中较为常用部分)标题:表示方法:# 一级标题效果预览:一级标题规律:#号数量代表标题级数分割线:--- ⚠️三个即可~文本:效果表示方法备注倾斜文本*倾斜文本* OR _倾斜文本_emmm并没有用过加粗文本**加粗文本** OR __倾斜文本__没用过+1标记文本==标记文本==这个的话我一般用来标记重要文本print()``这个的话一般我是用来标记重要的函数

2021-08-02 23:28:35 72

原创 利用Ancol PCA法将祖源计算器结果与实际情况相结合可视化分析

前言看到题目的小伙伴是不是内心有一万个❓是不是想问那个Ancol PCA是什么鬼。不知道正常,因为这词是我造的233333为什么叫这个名字:众所周知血统的英文是Ancestry,位置的英文是location,这俩单词取前三个字母,loc再倒过来去掉c,组合在一起不就是Ancol吗~PCA就是主成分分析的意思不变哦~下面教程正式开始:编程语言:python3.8模块:pandas numpy sklearn matplotlib geopy整体思路:先将计算器的多维数据降为二维数据并使其作为x

2021-07-28 17:03:15 198

原创 利用WeGene WGS给出的VCF文件输出类似WeGene芯片数据txt

利用WeGene WGS给出的CRAM文件输出类似WeGene芯片数据txt概述:编程语言:Python3.8模块:pyvcf csv可选:jupyter整体思路:识别WeGene芯片数据txt的文件特征,读取vcf文件并根据其中内容获取所需数据并写入到txt中前排提示:强烈建议买一个读写速度快一点而且至少是128GB或以上的U盘,当然我是直接买了个1T的移动硬盘步骤:通过观察微基因芯片测试txt结果,我们可以得知重要信息分别为:RSID chromosome position ge

2021-07-21 21:07:02 354 1

原创 降维维数以及距离算法对最终距离结果有影响

编程语言:python3.8模块:sklearn,matplotlib,pandas,scipy,numpy降维方法:原始PCA法原始数据维度:25维拟合方法:最小二乘拟合本人小白,若有错误,请各位大神轻喷!(求生欲满满)

2021-06-24 16:48:13 150

原创 用Python绘制发育树

用Python绘制发育树概述:编程语言:python3.8模块:biopython可选:jupyter整体思路:绘制发育树本次教程案例:母系单倍群A8a的分化树步骤:在txt上按照 (子支1,子支2)母支 来写txt文档,若需要加上MRCA,格式:(子支1:MRCA1,子支2:MRCA2)母支:MRCA3以newick格式读取该txt文件,并使用common_ancestor().color语句设置颜色。这里我是按照地理分布分别标记颜色。不过比较郁闷的是没法设置图例。

2021-06-24 16:42:48 731 1

原创 用自己的祖源成分数据与其他祖源成分数据做对比

用自己的祖源成分数据与其他祖源成分数据做对比概述编程语言:python3.8模块:pandas numpy matplotlib可选:jupyter整体思路:读取csv并生成热力图便于对比步骤:见代码上注释代码:import pandas as pdimport numpy as npimport matplotlib.pyplot as plt# 读取csvdf = pd.read_csv('e11.csv', index_col = 0, header = None)#

2021-06-23 16:42:22 116

原创 利用Python读取fasta文件并进行一系列操作(三)

利用Python读取fasta文件并进行一系列操作(三)概述:本节目标:计算智人与猩猩ABO基因的相对熵语言:python3.8模块:pysam, scipy整体思路:先计算出序列中“AG”“CT”“AC”“AT”“GC”“GT”六种组合序列所占比,再计算相对熵步骤:利用pysam模块分别读取智人ABO基因所有序列和猩猩ABO基因所有序列import pysam as samfrom scipy import statshfasta = sam.FastaFile('homo_

2021-06-23 16:39:16 936

原创 利用Python读取fasta文件并进行一系列操作(二)

利用Python读取fasta文件并进行一系列操作(二)概览:本节目标:通过上一节所输出的txt输出ABO蛋白以及ABO基因的外显子fasta文件语言: python3.8模块:biopython ssl可选:jupyter整体思路:通过ncbi获取ABO基因外显子位置(爬虫),并读取txt,根据位置信息获取外显子序列,再通过外显子序列输出mRNA序列以及蛋白序列前排提示:本教程不管生物,有知识盲区自己补步骤:设置ssl,要不debug后总会有bug从这步开始调用biopyt

2021-06-20 21:22:17 1839

原创 利用Python读取fasta文件并进行一系列操作(上)

利用Python读取fasta文件并进行一系列操作(上)概述语言:python3.8模块:pysam collections可选:jupyter整体思路:将fasta格式的基因原始数据处理为方便读写的txt格式并进行操作步骤:获取自己的fasta文件(这里我将从NCBI上下载人类的ABO基因参考序列的fasta文件为例)利用pysam模块的FastaFile函数读取fasta,之后即可获取fasta的基本信息:filename 文件名,references 染色体编号(因为这里我下

2021-06-18 22:39:39 8104 2

原创 利用自己的祖源成分结果画祖源成分饼图

利用自己的祖源成分结果画祖源成分饼图方法一:编程法概述编程语言:python3.8模块:matplotlib(当然如果要是通过读取csv或excel表格的话肯定还少不了pandas)可选:jupyter notebook整体思路:祖源成分数据的可视化优势:在数据量较大的时候较方法二速度快代码如下图所示:import matplotlib.pyplot as plt# 设置显示中文plt.rcParams['font.sans_serif'] = ['SimHei']# 准备数

2021-06-17 23:03:58 191

原创 利用G25祖源计算器坐标画PCA散点图

利用G25祖源计算器坐标画PCA散点图概述编程语言:python3.x模块:numpy sklearn matplotlib可选:jupyter整体思路:将G25给出的25维坐标降维并画图二维PCA散点图步骤:先把自己手中的G25坐标数据集整理成csv读取csv文件(此处我直接用的numpy读取,用csv模块或pandas也可)将读取的数组利用sklearn降维(此处的n_components表示降维后的维度,既然是二维图,所以是2)用matplotlib画散点图代码:

2021-06-15 10:57:55 504 2

人类过敏源数据库1058

http://allergen.org/index.php

2022-01-17

三祖源计算器所有位点Fst

其中包含k12b、k47、lm-k3

2022-01-16

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除