利用Biopython 快速根据pmid 来下载参考文献信息

之前用的常规爬虫思路(import requests,from bs4 import BeautifulSoup)来下载文章题目,作者,来源等信息时, 偶尔会出现各种问题,有那个调试的时间,就自己根据biopython快速写了一个脚本 ,简单好用。

# !bin/python
# encoding:utf-8

from Bio import Entrez
from  Bio  import Medline
Entrez.email = 'xxxx@qq.com'
ref = open('ref.txt','w+')
def downref(pmid):
    handle = Entrez.efetch(db="pubmed" , id=pmid , rettype="medline" , retmode="text")
    records = Medline.parse(handle)
    records = list(records) # records 是一个迭代器,所以只能访问这些records一次。如果想保存这些records,需要把他们转成列表。

    for record in records:
        print "title:" , record.get("TI" , "?")
        if len(record.get("AU" , "?"))>3: 
            author = ','.join(record.get("AU" , "?")[0:3]) #如果名字很多时,作者名字取前三个
            print 
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值