biopython 根据关键词在NCBI上查找文献

最新推荐文章于 2022-03-31 11:45:00 发布

爱笑的小牙

最新推荐文章于 2022-03-31 11:45:00 发布

阅读量1k

点赞数

分类专栏：生物信息分析

本文链接：https://blog.csdn.net/cassiel60/article/details/90664397

版权

生物信息分析专栏收录该内容

45 篇文章 18 订阅

订阅专栏

Biopython是python的一个库，帮助生物学家解决感兴趣的事情。功能很多，比如：处理序列，解析序列文件格式（FASTA,GENEBANK），连接生物学数据库（NCBI，ExPASY，SCOP）。

如：我们想在NCBI的PubMed数据库中查找与epilepsy相关的文章，然后输出title,author,source这些信息，这些对于在报告中显示参考文献时，很有必要。不用biopython时，可以通过已知的PMID，用爬虫的方法查找这些信息，以固定的格式输出。

from Bio import Entrez
Entrez.email = '743818953@qq.com'   # always tell who you are
handle = Entrez.egquery(term="epilepsy")
record = Entrez.read(handle)
for row in record["eGQueryResult"]:
     if row["DbName"]=="pubmed":
         print row["Count"]         #total 143833

使用 Bio.Entrez.efetch这个函数来下载这些篇文章的PubMed IDs：因为太多，

使用Bio.Entrez.efetch这个函数来下载这些文章的PMID,因为太多，所以就取这个list中的前40个

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

爱笑的小牙

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Biopython根据关键词在NCBI上查找文献

Cassiel60的博客

05-29

2850

Biopython是python的一个库，这个库可以解决很多生物上的问题，使大量的生物数据简单化，是个很好用的包。对于数据库上的各种信息，有专门的函数处理，不用按照常规的文本处理方法，写大量的代码。比如很常见的报告中展示的参考文献，一般思路是有了文章的PMID，然后通过爬虫的方法，获取这些文章的title，author，source等信息。在Biopython中有自己独特的解决方法。在NC...

ncbi查找目的基因序列_技能篇 | NCBI的5种常见使用方法（二）

weixin_42515340的博客

01-03

1万+

上期回顾：技能篇 | NCBI数据库使用教程(一)一、查找基因序列、mRNA序列进入NCBI 主页，在 search 后面选择 Gene，输入需要查找的基因的名字，点击search，查看结果。以基因P53为例，搜索结果如图：点击红框部分，进入并下拉，可以看到大量的信息，如下图：二、用Probe查找已经公布的引物序列进入NCBI主页，在下拉菜单选择Probe之后填写需要查找的基因名称。点击searc...

参与评论您还未登录，请先登录后发表或查看评论

ncbi 关键字组合查询bioProjectID - 爬虫

Julse的博客

09-06

1615

问题有两种关键字，需要在ncbi上面进行查询，返回bioProjectID 查询完发现网站地址如下：这就是我们需要请求的页面 https://www.ncbi.nlm.nih.gov/bioproject/?term=(frontal%5BAll+Fields%5D+AND+ASD%5BAll+Fields%5D)+AND+%22org+human%22%5BFilter%5D 点击查看此时的网页 1 处是我们的筛选条件 2 处是我们需要返回的bioProjectID 请求地址是： 'https://w

搜索文献_文献快速搜索

weixin_39756540的博客

12-21

本文中小编会讲述3个有关文献搜索的技巧，帮助小伙伴们快速搜索，加速科研！TIPS1：如何通过限制IF来搜索文献1. 首先要注册一个NCBI的账号，建议使用google或hotmail等国际通用邮箱2. 在PubMed的右侧，我们会看到有个限制条件的管理链接3. 点进去可以选择数据库、创建常用限制条件，选择限制条件。默认列出的这些条件都是常用的，包括语言，研究对象类型，文献类型等等4. 如...

如何通过爬虫批量获得具有关键字的NCBI蛋白质序列

qq_23341021的博客

03-31

1734

以关键字“Lysin”为例，https://www.ncbi.nlm.nih.gov/protein/?term=lysin，我们打开网址发现关于Lysin的蛋白质序列一共有13708页，每页有20条蛋白信息，通过点击FASTA，我们找到了对应蛋白的氨基酸序列，通过尝试不同序列的FASTA，我们发现其url的后缀为其蛋白的Accession号，因此我们只要得到蛋白的Accession号，我们就可以通过网址链接获取蛋白质的氨基酸序列，第一页20条蛋白的Accession号我们可以通过网址链接加...

用python编写一个程序，使用Biopython查找Aspirin与疾病相关文献并输出查得文献总数。利用paperscraper下载至少三篇文献。请写出实现程序的代码并试运行出代码结果。

最新发布

05-22

biopython中文指南.zip

06-06

6. **Bio.Entrez**: 是一个用于检索和下载NCBI Entrez数据库数据的模块，包括PubMed文献、核酸序列、蛋白质序列等。 7. **BioSQL**: 为存储和查询生物序列提供了一个SQL数据库接口，可以方便地管理和共享生物数据。...

Python库 | biopython-1.40b.tar.gz

03-01

2. **数据库访问**：Biopython支持与NCBI Entrez、Ensembl、UniProt等生物信息学数据库的交互，让你能够方便地检索和下载基因组、蛋白质序列、文献等信息。 3. **结构生物学**：对于蛋白质结构，Biopython提供了PDB...

cbbl:从NCBI核苷酸数据库下载所有cbbl基因并以fasta格式输出的脚本

04-28

`biopython`库提供了对Entrez API的封装，可以方便地执行E-Search（查找文献）、E-Fetch（获取文献数据）等操作。以下是可能的脚本执行步骤： 1. **搜索基因**：使用`biopython`的`Entrez.esearch()`函数，输入...

向NCBI上传16S rDNA数据的操作详解

yue81560的博客

07-09

2万+

专门介绍向NCBI上传16S rDNA数据的方法不太多。因为自己有上传数据的需要，所以决定边摸索边写下操作流程。如果这篇博文交代了上传步骤以及一些描述文件属性的书写，帮到你的话，还请点赞收藏。

如何到NCBI提交基因组

dej0257的博客

03-29

6247

1 步骤和说明 NCBI官方说明点此处打开提交基因组页面以下例子：纯菌的基因组草图用于新菌鉴定。 1.1 提交基因组数据到 NCBI 需要什么？ .fsa 格式的基因组数据； fsa 就是用公司返回的 .sqn 的数据改为 .fsa 后缀，里面是 fasta格式的逐条 scarfold 或者 contig。每条序列有唯一的编号，例如contig1，长度不超过50，其他说明不是...

ncbi查找目的基因序列_如何利用NCBI查找某物种的特定基因CDS序列和蛋白序列

weixin_32290249的博客

01-03

1万+

一、应用场景需要表达某物种的特定蛋白或基因二、序列获取方法：1. 打开NCBI网站（https://www.ncbi.nlm.nih.gov）2. 点击下图红色箭头指示的下拉框3. 找到下图所示的“Gene”4. 选中“Gene”，在右边的搜索对话框中输入需要查找的基因名称。下图以 “DNA连接酶”为例，在对话框中输入 “DNA Ligase”，再点击最右边的Search。5. 出现如下页面，...

Biopython从NCBI搜索和取回数据库记录

sunchengquan的博客

12-04

5823

Entrez模块Entrez提供了链向在NCBI服务器的esearch和efetch工具的连接列出Entrez模块的方法和属性from Bio import Entrez s = dir(Entrez) print(s)运行结果： ['_HTTPError', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__

NCBI使用方法

csdnmakeer的专栏

01-17

1万+

NCBI使用方法作者 : 郭亚雄 NCBI NCBI (National Center for Biotechnology Information), 美国国家生物技术信息中心 http://www.ncbi.nlm.nih.gov/ NCBI是NIH的国立医学图书馆（NLM）的一个分支。 NCBI提供检索的服务包括： 1．GenBank

optionsbuilder.isconfigured 一直为false_做「容量预估」可没有true和false

weixin_39998541的博客

11-30

341

我是一个着迷于产品和运营的技术人，乐于跨界的终身学习者。欢迎关注我哟～每周五早6点按时送达～我的第「85」篇原创敬上随着20年来互联网的蓬勃发展，一个软件系统所要面对的访问压力上限被逐渐提高。虽然如此，但是那些体量达到亿级或者是千万级的产品也只是少数公司的专属。对于整个行业里百万+的程序员群体来说，估计也就只有10%人有机会接触到这些“大系统”。所以，一提到容量预估，大家可能第一时间想到的是，...

NCBI生物分类数据库（Taxonomy）

Baimoc

07-10

2万+

文章目录介绍查询某个物种的全部核酸序列和蛋白序列查看某个物种的其他信息（蛋白结构，基因，测序数据，相关文献等）Taxonomy 的相关数据下载**gi_taxid 标识的数据****taxcat 标识的数据**以尼安德特人（taxid：63221）为例介绍 Taxonomy : NCBI公共序列数据库中所有生物的策划分类和命名法。目前包含地球上大概10%的物种。我们现在查询到底包含有有多少物种...

利用NCBI的序列号下载所有样本的说明信息

李将军的博客

02-27

4323

例如文章中提到：来自该研究的所有RNA-seq数据可通过NCBI序列阅读档案（SRA）（http://www.ncbi.nlm.nih.gov/sra）下载，登录号为SRR2089755。进入该网站搜索该序列号，如图选中所有样本，点击send to 点击run selecter，点击go，进入如下页面选中所有样本，点击runinfo table就得到所有样本的患病信息 ...

【论文查询】如何查询论文被其他哪些文献引用过？超详细！！！