科研之友爬虫数据解析
"""
科研之友学者主页解析数据框架
# 名字(name)
# 科研之友号(id)
# 学校(school)
# 职称(position)
# 地区(region)
# 项目(project)
# 成果(outcome)
# 阅读(read)
# 下载(download)
# 引用(Reference)
# H指数(H_index)
# 科技领域(field)
# 关键词(keywords)
地区和学校失败
"""
import requests
from bs4 import BeautifulSoup
import time
import re
headers = {
'User-Agent': 'Mozilla/5.0'}
def get_info(url):
#定义获取网页信息的函数
names = []
ids = []
schools = []
positions = []
regions = []
projects =