网络爬虫
jxcard_lzy
这个作者很懒,什么都没留下…
展开
-
网络爬虫(四)
模拟登录B站导包import base64import timefrom PIL import Imagefrom selenium import webdriverfrom selenium.common.exceptions import TimeoutExceptionfrom selenium.webdriver import ActionChainsfrom seleni...原创 2019-11-22 11:55:26 · 220 阅读 · 0 评论 -
网络爬虫(三)
爬取人民网新闻导包import requestsimport reimport chardet发送请求,获取响应def get_html(url): headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3...原创 2019-11-22 10:54:04 · 157 阅读 · 0 评论 -
网络爬虫(二)
爬取海王电影20180101-20190101影评导包import jsonimport timefrom datetime import datetime, timedeltaimport requests发送请求,获取响应# 发送请求,获取响应def get_data(url): headers = { 'User-Agent': 'Mozilla/5...原创 2019-11-22 10:48:26 · 114 阅读 · 0 评论 -
网络爬虫(一)
本文章目的是爬取豆瓣电影top250导入所需的包import requestsimport reimport csvfrom requests import RequestException发出请求,解析响应def get_url(url): try: header = { 'User-Agent': 'Mozilla/5.0 (Wi...原创 2019-11-22 10:42:07 · 160 阅读 · 0 评论