通过python获取谷歌学术搜索结果

本文介绍了如何使用scholarly这个Python库从Google学术中批量获取关于‘multiplepointgeostatistics’的研究结果,通过模拟浏览器请求抓取数据,将上千篇论文信息整理并保存至JSON文件MPS.json。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

谷歌学术是重要的科研利器,搜索结果通常上千个,每次只能看几个,通过开源的接口,可以批量获取搜索结果,方便快速综合分析。

这里用到的库是scholary,可以指定获取多少个结果,每个结果是个dict,可以把多个dict结果写出到json文件保存。

'scholarly 是一个Python库,用于从Google Scholar获取学术文章的信息。它可以查询论文、作者信息、引用情况等,而无需直接与Google Scholar的网页界面交互。scholarly通过模拟浏览器请求来抓取网页数据,解析这些数据,并提供一个简单的Python接口来访问信息。"

# pip install scholarly
from scholarly import scholarly
import time
import json
search_query = scholarly.search_pubs('multiple point geostatistics')
print(search_query.total_results)
paper_list=[]
for i in range(100):
    try:
        paper = next(search_query)
        print("---------------------{}-------------------".format(i))
        paper_list.append(paper)
    except:
        time.sleep(30)
with open('mps.json','w') as file:
    json.dump(paper_list, file, indent=4)

下面是获取过程的跟踪

结果最后写出到mps.json文件,截取的部分内容如下

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

oceanstonetree

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值