python 标识符最大长度_Biopython(或者只是Python)：使用gi标识符从一个大的.fasta文件中解析物种名称的最有效方法...

最新推荐文章于 2022-09-13 22:52:49 发布

studyaicom

最新推荐文章于 2022-09-13 22:52:49 发布

阅读量160

点赞数

本文链接：https://blog.csdn.net/weixin_36216860/article/details/112959704

版权

fasta文件 GI号物种信息 BioPython 序列解析

关键词由CSDN通过智能技术生成

我有一个.fasta文件(基本上是.txt)约145000个条目，格式如下

>gi|393182|gb|AAA40101.1| cytokine [Mus musculus]

MDAKVVAVLALVLAALCISDGKPVSLSYRCPCRFFESHIARANVKHLKILNTPNCALQIVARLKNNNRQV

CIDPKLKWIQEYLEKALNKRLKM

>gi|378792467|pdb|3UNH|Y Chain Y, Mouse 20s Immunoproteasome

TTTLAFKFQHGVIVAVDSRATAGSYISSLRMNKVIEINPYLLGTMSGCAADCQYWERLLAKECRLYYLRN

GERISVSAASKLLSNMMLQYRGMGLSMGSMICGWDKKGPGLYYVDDNGTRLSGQMFSTGSGNTYAYGVMD

SGYRQDLSPEEAYDLGRRAIAYATHRDNYSGGVVNMYHMKEDGWVKVESSDVSDLLYKYGEAAL

>gi|378792462|pdb|3UNH|T Chain T, Mouse 20s Immunoproteasome

MSSIGTGYDLSASTFSPDGRVFQVEYAMKAVENSSTAIGIRCKDGVVFGVEKLVLSKLYEEGSNKRLFNV

DRHVGMAVAGLLADARSLADIAREEASNFRSNFGYNIPLKHLADRVAMYVHAYTLYSAVRPFGCSFMLGS

YSANDGAQLYMIDPSGVSYGYWGCAIGKARQAAKTEIEKLQMKEMTCRDVVKEVAKIIYIVHDEVKDKAF

ELELSWVGELTKGRHEIVPKDIREEAEKYAKESLKEEDESDDDNM我有一个gi列表(在|之后列出的第一个数字)。

此列表的大小在给定测试的60-600 gi之间变化

我想返回一个包含这些gi的相应种类的列表

物种名称通常在第一个例子中被看到(被方括号[Mus musculus]包围)，但并不总是存在。

订单并不特别重要。

我一直在使用各种BioPython解析代码，但我认为由于搜索的大小，它失败了。我希望在这里有人会知道更有效的方法？

提前致谢！

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

studyaicom

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

【Python面试必看系列】之Python 中的标识符长度能有多长？

若北辰

09-02

2871

Q 19. Python 中的标识符长度能有多长？在 Python 中，标识符可以是任意长度。此外，我们在命名标识符时还必须遵守以下规则：只能以下划线或者 A-Z/a-z 中的字母开头其余部分可以使用 A-Z/a-z/0-9 区分大小写关键字不能作为标识符 ...

06- Python的标识符

huanghong6956的博客

08-29

898

标识符是用来标识变量、函数、类等的名称。它们由字母、数字和下划线组成，但不能以数字开头。扩展解释与示例：关键词：在 Python 中，关键词是有特殊意义的单词，不能用作变量名。例如，、、都是 Python 的保留关键词。要查看所有关键词，可以使用后执行。内建标识符：内置标识符是 Python 在启动时自动导入的标识符，这些标识符通常是常用的函数和异常处理机制，例如、和。特殊变量和方法：例如，是类的初始化方法，在实例化对象时自动调用；作为类的“受保护”变量，只在类及其子类中使用。合法标识符：

参与评论您还未登录，请先登录后发表或查看评论

python标识符最大可能长度_Opencv-Python学习笔记（二）

weixin_39605191的博客

12-09

243

2. 使用OpenCV3处理图像2.1 不同色彩空间的转换OpenCV中有数百种关于在不同色彩空间之间转换的方法。三种常用色彩空间：灰度、BGR、HSV(Hue色调，Saturation饱和度，Value亮度)注：计算机遵从加色模型，而绘画遵从减色模型。2.2 傅里叶变换傅里叶变换作用：可以用来区分图像里哪些区域的信号变化特别强，哪些不那么强，从而可以任意标记噪声区域、感兴趣区域、前景和背景。幅度...

《Python 3程序开发指南（第2版•修订版）》——2.4 字符串

weixin_34129145的博客

05-02

151

本节书摘来自异步社区《Python 3程序开发指南（第2版•修订版）》一书中的第2章，第2.4节，作者[英]Mark Summerfield，王弘博，孙传庆译，更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.4 字符串字符串是使用固定不变的str数据类型表示的，其中存放Unicode字符序列。str数据类型可以作为函数进行调用，用于创建字符...

python标识符最大可能长度_安全检查中...

weixin_39527768的博客

12-09

276

+((!+[]+(!![])+!![]+!![]+!![]+!![]+!![]+!![]+[])+(+!![])+(!+[]+(!![])+!![]+!![]+!![]+!![]+!![])+(!+[]+(!![])+!![]+!![]+!![])+(!+[]-(!![]))+(!+[]+(!![])+!![]+!![])+(!+[]+(!![])-[])+(!+[]+(!![])+!![]+!!...

mysql标识符长度限制_数据库的标识符可以有多长

weixin_29801567的博客

02-05

1007

前言今天在查看项目代码时发现有这样一个逻辑：在查询数据库时通过代码去拼接一个SQL，这个SQL的某个字段的别名是由多个变量名拼接而成的，于是在拼接该别名时特地限制了其长度为30，如果超过30就只截取前30个字符来作为列别名。一时间很好奇为什么要限制列别名的长度，查阅过资料才明白，原来数据库的名字、表名、表别名、列名、列别名和函数名等，这些都属于标识符，不同数据库对于标识符会限定各种的长度最大值。关...

python的标识符

weixin_52211352的博客

12-17

851

标识符是一些事物的名称和符号。有如下规则：严格区分大小写。可以使用数字、字母、下划线。但不能以数字开头。见名知意。不能以关键字进行命名。注意： • 不能以特殊字符开头。 • 以下划线开头的标识符具有特殊含义，尽量避免使用这类标识符命名。 python关键字如下： False class from or None continue global

susCovONT:通过ONT测序生成共识文件.fasta文件并识别穿山甲谱系和Sars-CoV-2基因组的下一个菌株的管道

03-19

通过ONT测序生成共识文件.fasta文件并识别穿山甲谱系和Sars-CoV-2基因组的下一个菌株的管道。该管道将名称为的文件夹作为输入，其中包含来自Sars-CoV-2 ONT测序的文件夹fast5_pass和fast5_pass以及fastq_pass ...

python处理fasta文件_Python脚本：fasta文件单序列信息提取

weixin_39810901的博客

12-14

2036

使用Python对fasta格式的序列进行基本信息统计预期设计输出文件中包括fasta文件名，序列长度，GC含量以及ATCG各自的含量。Python脚本编辑使用的文件test.fastastat.py输入 sys模块#!/usr/bin/env pythonimport sys从命令行获得文件名称file_fasta = sys.argv[1]#获得文件名file_name = file_fast...

用python解决：1.安装Biopython模块，并利用该模块将 NC_045512_N.fasta 文件中的序列翻译成氨基酸序列，并输出为fasta格式文件。

热门推荐

技术小白

07-24

2万+

简单地理解，标识符就是一个名字，就好像我们每个人都有属于自己的名字，它的主要作用就是作为变量、函数、类、模块以及其他对象的名称。Python中标识符的命名不是随意的，而是要遵守一定的命令规则，比如说： 1.标识符是由字符（A~Z 和 a~z）、下划线和数字组成，但第一个字符不能是数字。 2.标识符不能和 Python 中的保留字相同。有关保留字，后续章节会详细介绍。 3.Python中的标...

python变量标识符是一个字符串、长度没有限制_学Python划重点一(Python基础、数字类型、字符串、语句)...

weixin_39791349的博客

01-29

1110

前言：学过c、java后来学python相对快很多，不过它们之间还是有很多的不同之处，这里只总结一些它们的不同之处，主要用于自己的复习。一、Python基础1. 标识符和关键字标识符就是变量、常量、函数、属性、类、模块和包等由程序员指定的名字。2. 变量和常量在Python 中，不需要事先声明变量名及其类型，直接赋值即可创建各种类型的对象变量。Python 采用的是基于值的内存管理方式，如果为不...

不同数据库标志符长度限制总结

学无止境

07-21

3758

测试环境及数据库版本信息操作系统：Win7 Mysql版本：5.6.24 Oracle版本：11gR2 Postgre版本：9.4 SQLServer版本：2008 1、不同数据库标识符长度限制长度单位：字符；数据库名称表名称列名称索引名称别名 MySQL

Biopython 分析序列

wangprince2017

12-09

1633

数据下载https://www.ncbi.nlm.nih.gov/nuccore/NC_000006.12?report=genbank&from=31164337&to=31170682&strand=true 1 读取常见的序列文件格式（fasta，gb） 2 浏览 fasta 序列文件内容 from Bio import SeqIO # 读取包含单...

Python的标识符

Kailin_lin的博客

08-20

6265

什么是标识符？ 标识符指的是一串字符串（注意：字符串未必是标识符）规则 标识符的规则表示为：只能由字母、数字和下划线组成，开头不能是数字，也不能是Python的关键字。Python的关键字如下： import keyword print(keyword.kwlist) 打印出来的结果如下： (https://img-blog.csdn.net/20180814150234381?wa...

使用Python脚本读取fasta文件

qq_53666171的博客

09-13

2066

使用Python脚本读取fasta文件