自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 收藏
  • 关注

原创 沃酶生物抗体筛选外包=博士毕业救命稻草

就在实验失败了n次后。终于迎来了转机 ,联系到一个学长,说他知道一家靠谱的专门做噬菌体展示的公司,跟他仔细聊了一下,才知道他以前去深圳工作的时候认识一个同事,她专门做抗体筛选,做过杂交瘤抗体筛选、噬菌体展示抗体筛选、酵母展示抗体筛选,简直就是神手、他们部门领导都感慨,论抗体筛选,我们这个平台所有人加起来都不顶她一个,做啥成啥,同样是其他同事做相同的事情,甚至在筛选细节上明明跟她做的一样,甚至按照她的方法同步一起做,一样的东西,出的结果差别咋就这么大呢?就这样,兢兢业业做了3年实验,博后师姐也顺利出站。

2024-05-09 15:56:01 1003

转载 gromacs运行报错——不能自动生成更新后的top文件

gromacs运行报错——不能自动生成更新后的top文件,解决方案

2024-01-24 12:08:11 206 1

转载 如何提高tRNA与mRNA正确结合效率——codon pair优化

蛋白质合成过程中,核糖体蛋白和密码子与反密码子对在核糖体的 P 位和 A 位上形成的空间结构影响了翻译的精确性和速率,而这种空间结构的稳定性是影响密码对使用偏好性的主要原因。详细内容具体可以参考下西北农林科技大学2011赵胜博士毕业论文《478种生物的密码对使用偏好性及其与翻译效率的相关性研究》。

2024-01-11 16:13:34 118

转载 数独游戏的代码解题思路和过程

com1变量为[(6, 3, [3]), (5, 3, [5]), (4, 3, [2]), (9, 3, [6]), (8, 3, [8]), (3, 3, [9])],如(6,3,[3])表示第六行第三列的格子拥有唯一值3;现在只找到6个含有唯一值的格子,并没有求出所有的值。对于简单的数独,通常利用排除法,每次会确定一到多个符合要求的唯一解的格子,对于复杂的高难度的数独,通常需要从候选的排列组合中先假设一个确定值,在后续的逻辑推算中,如果假设值满足要求则表明假设正确,不满足则排除此假设值。

2023-10-08 11:39:54 334

转载 RNA序列优化评分:吉布斯自由能批量计算

selenium无法获取下的内容解决办法

2023-08-21 10:15:18 320

转载 利用pymol批量对PDB文件三维结构比对并输出RMSD值

经验上、文献上大量的蛋白质或者核酸比对工作是从一级序列开始的,这是基于一级序列决定二级结构,二级结构决定三级结构,而且一级序列有30%的相似性,那么两者的结构就具有较高的相似性这样的共识理论而来,这些理论也是基于现有的实验数据得来的,然而也存在很多例外的情况,如相似度高的蛋白序列,三级结构差异较大,或者相似度低的蛋白序列却具有较高的三级结构,又或者一些理论认为柔性蛋白可能具有更好的蛋白热稳定性,刚性太强反而在更剧烈的环境中更容易崩溃。

2023-07-27 16:42:19 2320

转载 如何统计PDB文件二级结构的多少及位置并和作图

很多时候我们想要展示蛋白质二级结构的多少和位置,如下简单介绍了两种可以实现此要求的方法。

2023-04-19 14:51:34 1228

转载 序列排列组合代码实现以及ChatGPT、文件工具分享

工作中有很多文件,其大小可能到几百兆甚至以G计算,电脑自带的txt处理文本,打开非常缓慢,有一个能快速打开并处文本的工具,特别是在windows下,将非常有意思。模拟随机抽样缺点:随机产生,序列越长,后续随机抽取的重复样本越多,越到后面出现新序列的时间呈现指数增加,可能永远也不能得到所有的排列组合,程序会一直运行;较少的片段组合,则可以考虑顺序抽样,弥补样本库的不足。有时候我们需要对序列进行排列组合得到新的突变,这里有点像不放回的、有顺序的抽样,我们有两种思路,第一种模拟随机抽样,第二种顺序抽样。

2023-04-12 15:35:50 381

转载 噬菌体展示抗体库的兼并引物设计

传统抗体库筛选是构建免疫细胞的杂交瘤细胞,然后进行体外扩增表达,优点是产生的抗体为天然抗体,缺点是构建的杂交瘤细胞库数量较少,一次需要多只免疫动物,而且需要培养细胞,换液等频繁操作,费时费力不说,还浪费钱。如可在NCBI中获取兔igg抗体,通常我们得到的igg的轻链和重链,同时我们需要注意的是重链通常有alpha、δ、e、gamma、μ等组成,而igg重链是gamma,所有抗体的轻链由λ或者k组成,但注意部分标记λ或者k的不一定指的是抗体序列。四、多条不同序列的兼并引物设计。一、获取目的抗体序列。

2023-04-04 11:49:53 1091 1

转载 如何对构建基因克隆的测序结果批量进行序列比对并输出结果

做过克隆构建的人都知道,有时候我们需要对测序结果进行分析,查看测序结果是否与我们想要构建的序列是否一致,即使是构建同一条序列的克隆,有时候根据实验实际情况,我们需要测序的单克隆不止两三个,有可能是五六个,也有可能是几十上百个,面对大量的测序结果,如果我们进行一一翻译比对,那么无疑花费我们大量时间,耗费不少精力,下面展示如何通过代码进行批量的处理并输出结果。四、寻找并输出突变位点(不突变输出None)一、读取测序数据并进行相关设置。三、将翻译的数据进行清洗打包。二、将合格测序数据整理打包。

2023-03-20 17:12:44 1286

转载 web自动化文件上传及验证码识别

验证码是网页识别机器还是人的一种方法,这为爬虫带来了一定难度。本章我们演示了如何批量上传文件到网页,以及识别验证码进行访问。

2023-01-24 20:56:26 244

转载 pdb文件的盐键如何计算

众所周知,氨基酸属于两性化合物,既带正电荷也带负电荷,这是因为所有的氨基酸至少有一个羧基和一个氨基,羧基容易失去氢成为氧负离子,氨基容易得到氢成为带正电荷铵盐,当带负电荷的氧和带正电荷的氨在一定接触距离时,则会产生电荷吸引作用,俗称盐键,跟氯化钠成键有点类似。这些带不同电荷的集团之间会形成盐键(盐桥或者离子键)。

2022-12-13 13:15:25 637

转载 蛋白质Pdb文件的氨基酸接触网络矩阵生成以及生成networkx的几个中心值

蛋白质PDB文件氨基酸接触网络的生成以及networkx四个中心值(betweenness_centrality,closeness_centrality,degree_centrality,clustering)的生成

2022-11-14 21:53:10 743 1

转载 利用代码将网站预测蛋白稳定性突变自动化

蛋白的热稳定一直是蛋白类药物或者产品生产及保存运输要考虑的重要问题,现在有不少软件可以预测能提高蛋白热稳定性的突变体,而且有很多还是在线网站,能节省不少计算资源。但是很多在线网站的特点是每次预测都要重新输入值,然后提交得到新的结果。如果有大量预测,那么无疑是费时费力的,这个时候就需要网页自动化测试技术了。本文以裂解酶的热稳定预测为例,展示如何进行完整的自动化预测和结果输出。

2022-11-05 16:51:36 981 1

转载 分子对接时常见的一些报错解决----金属离子错误

金属离子对分子对接的结果有没有影响我不知道,但是分子对接的力场参数中含有金属离子,且很多金属离子作为蛋白活性位点的结合点,直接蛋白活性,那么考虑金属离子的参数还是很有必要的,本文解决pdb文件中ZN离子报错问题......

2022-07-28 11:14:16 6223

转载 AUTODOCK分子对接

利用分子对接可以做大量药物筛选工作、同时也能更好理解蛋白大分子和配体之间的相互作用

2022-07-08 10:20:23 3917 1

转载 膜蛋白分子动力学模拟流程

分子动力学模拟可以从干实验模拟湿实验过程,大大的节省了实验的时间、人力、金钱成本。蛋白质等大分子研究的利器

2022-06-11 00:11:40 1052

转载 如何提高计算资源——多进程并行计算(文末有一个循环计算小游戏)

相必大家对计算机cpu的核数应该了如指掌吧,核数越多,运行速度越快,那么在linux系统上,如何利用cpu的核呢?一般Linux终端程序运行时只有一个进程,一个进程也可以理解为只用了一个核,如果你的电脑配置为10核的话,那你才用了1/10的计算资源,相当于你用高配置的电脑跑一个在低配置电脑(1-2核)需要30min运行的程序所花时间是一样的。并行计算也叫做多进程计算,指的是同时调用多个计算机内核一起工作;并发计算叫做多线程计算,是一个进程的多个程序轮换交替运行,并发计算的好处是单个程序的拖延...

2022-05-14 22:55:38 532

转载 通过特征量来预测蛋白热稳定性——BP神经网络

神经网络和随机森林都是机器学习的方法,神经网络也是深度学习的方法。

2022-05-10 22:30:16 339

转载 通过氨基酸频率特征量来预测蛋白热稳定性——随机森林算法

随机森林作为一种机器学习、预测算法,在人工智能领域是非常受欢迎的,生物信息学同样也可以利用它作为预测新样本的某些特性。

2022-05-10 22:07:03 1024

转载 网络爬虫加强版——爬取网页源代码不展示内容以及编码无规律内容

网络爬虫想要爬取的内容越加精炼,格式越统一,那么要求所要被爬去网页编码格式更加一致,这样才不会中断爬虫或者减少爬取信息。魔高一尺,道高一丈,网络爬虫和反扒机制一直都是对抗提升中,为了减少花更多时间和精力在寻找网页编码规律上,我们舍弃计算量和精度来达到我们信息搜索的目的,毕竟电脑是不会感到疲惫的。 以南开大学生科院师资力量为例,还是爬取符合关键字的导师网址。一、爬取导师介绍网址 一般我们通过网页源代码去发现导师网址在哪一个标签下,然后通过获取该标签下所有的hr...

2022-04-04 21:12:26 2827

转载 研究生报考时利用爬虫筛选导师研究方向

相信每个报考研究生的人,经常为寻找专业对口的导师而发愁,如果一条一条找,很容易让人失去耐心,特别是对于我这种已经工作的人来说。下面就以武汉大学生科院导师研究方向为例,目的是找到匹配关键字的导师介绍网址。 本期内容还是要熟悉HTML网页结构,与如何通过网络爬虫获得NCBI蛋白质序列这期文章有相似的地方,这个以后抽时间可能会聊一聊。代码如下:一、获取所有武大生科院老师的公开网址信息​pythonfrom bs4 import BeautifulSoupimport requests...

2022-04-03 00:32:39 583

转载 如何通过爬虫批量获得具有关键字的NCBI蛋白质序列

以关键字“Lysin”为例,https://www.ncbi.nlm.nih.gov/protein/?term=lysin,我们打开网址发现关于Lysin的蛋白质序列一共有13708页,每页有20条蛋白信息,通过点击FASTA,我们找到了对应蛋白的氨基酸序列,通过尝试不同序列的FASTA,我们发现其url的后缀为其蛋白的Accession号,因此我们只要得到蛋白的Accession号,我们就可以通过网址链接获取蛋白质的氨基酸序列,第一页20条蛋白的Accession号我们可以通过网址链接加...

2022-03-31 11:45:00 1680

转载 蛋白质统计偶联分析(Statistical coupling analysis,SCA)---模块一报错问题解决

蛋白质中氨基酸位点之间的偶联对其功能和结构非常重要,如果采用生物信息学的方法进行氨基酸位点的偶联分析,可以克服传统生物学实验方法难以从宏观角度进行系统的功能分析的局限,这就是所谓的蛋白质统计偶联分析

2022-03-20 13:52:53 564

转载 新发变异株奥密克戎(Omicron)变异位点的获得及其核酸检测的引物设计

继2021年11月9号首次在南非报道了第一例Omicron病例,短短3个月内,南非豪登省出现该病例激增,且南非所有省份的Omicron变异毒株病例“似乎都在增加”。为应对可能到来的新发变异毒株,核酸检测是必不可少的工具,特异性的检测依赖特异性的引物;氨基酸变异位点是疫苗设计和抗体检测的依据,因此本章我们有两个任务,一个是设计特异性检测Omicron的引物,一个是找出Omicron突变位点。一、核酸检测引物设计 引物获得方法如前,由于NCBI...

2021-12-21 18:12:47 1944

转载 新冠病毒变异株核酸检测引物设计——代码实现2

上一期代码实现1中,我们利用kermer的思路,通过条件语句得到两个数据集,一个集合为包含单一毒株所有基因序列的20bp片段,另一个集合为同时出现同一株所有(不同基因组)的基因组中,本期内容我们将得到能满足基本要求候选引物。一、计算每个毒株kermer出现的百分比 上一期我们的想法比较理想化,使用“全”和“无”的思路去解决问题,事实上,我初步的结果无法满足我的要求。因此今天的文章我们做了更正,首先我们统计相应毒株kermer的序列在总kermer中出现的比例。代码如下:f = o...

2021-12-09 11:00:00 1300

转载 新冠病毒变异株核酸检测引物设计——代码实现1

上一期我们对新冠变异株核酸检测的方法原理进行了简介,本期我们主要讲一下,如何利用python语言实现我们特异性检测的目标。一、文件读取 接着上一期我们下载新冠Alpha、Beta、Delta、Gamma株的全部基因组序列后,我们发现同一株型的新冠基因组,以“>”分开不同测序基因组,序列总共有上千条,为了后面程序简便,我们将同一株型的新冠基因组文件读取并储存数组中,如Alpha株,其数组形式为:Alpha[“序列1”,“序列2”,“序列3”,......,“序列n”],其余毒...

2021-12-08 23:46:43 1881

转载 【无标题】新冠病毒变异株检测——荧光定量PCR检测技术开发

一、新冠病毒简介 2019新型冠状病毒(2019-nCoV,世卫组织2020年1月命名;SARS-CoV-2,国际病毒分类委员会2020年2月11日命名)简称“新冠”。 冠状病毒是一个大型病毒家族,已知可引起感冒及中东呼吸综合征(MERS)和严重急性呼吸综合征(SARS)等较严重疾病。新型冠状病毒是以前从未在人体中发现的冠状病毒新毒株。 2021年1月15日,英国已发现了一种来自巴西的变种新冠病毒。2月21日,据俄罗斯报道,在印度各地发现了多达240种新...

2021-11-26 11:29:31 2484

原创 Wetawrap kraken2运行报错KeyError“2304686”解决方案

本文的bug来自输入经过初步处理的宏基因组测序序列,在进行kraken2模块时,使用taxtonomy分类数据库时,如下图出现KeyError“2304686”我们根据提示路径打开kraken2_translate.py文件:#!/usr/bin/env pythonimport sysimport osdef get_full_name(taxid, names_map, ranks_map): """ Generate full taxonomic lineage

2021-09-08 09:00:55 706

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除