![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
Du_Jin_
这个作者很懒,什么都没留下…
展开
-
爬虫3 科研之友学者主页解析数据框架
科研之友爬虫数据解析"""科研之友学者主页解析数据框架 # 名字(name) # 科研之友号(id) # 学校(school) # 职称(position) # 地区(region) # 项目(project) # 成果(outcome) # 阅读(read) # 下载(download) # 引用(Referen...原创 2020-04-23 15:49:13 · 461 阅读 · 0 评论 -
爬虫2 百度学术网站输入关键词爬取数据框架
爬虫框架:以百度学术为例"""百度学术网站输入关键词爬取数据框架"""import requestsheaders = {'User-Agent': 'Mozilla/5.0'}def getHTMLText(url): try: # kv为检索关键词 kv = {'wd': 'python'} r = requests.g...原创 2020-04-23 15:45:51 · 509 阅读 · 0 评论 -
爬虫1 科研之友单个学者主页爬取网页数据框架
爬取源数据:以科研之友为例"""科研之友单个学者主页爬取网页数据框架"""import requestsheaders = {'User-Agent': 'Mozilla/5.0'}def getHTMLText(url): try: r = requests.get(url, headers=headers) r.raise_for_s...原创 2020-04-23 15:43:01 · 524 阅读 · 0 评论