爬虫
Robin C
Learning algorithm makes me happy!
展开
-
爬取【医疗问答】数据
本文章以 丁香 医生为例主要以 科目分类来进行爬取,每个科目爬取的内容会存储到一个文本文档中,内容是问答式。代码如下:from bs4 import BeautifulSoupimport pandas as pdimport jsonimport requestsimport timeimport randomdef get_static_url_content(url):...原创 2020-03-21 17:08:05 · 1638 阅读 · 4 评论 -
爬取百度咨询
爬取百度咨询版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。本文链接:https://editor.csdn.net/md?articleId=103447839 主要是抓取一些关键字的新闻,这篇博客是搜索的关于【华山】的最新资讯,输出结果为excel,主要包括三个字段:作者,时间,内容(新闻标题)。大致的流程为:获取ur...原创 2019-12-08 19:40:31 · 538 阅读 · 0 评论