Python—爬虫
爬虫基础
玉荒吹笛
爱IT,爱编程
展开
-
bs4.BeautifulSoup 模块
beautifulSoup 的简单使用原创 2019-02-23 13:57:52 · 1493 阅读 · 0 评论 -
HTTP知识
HTTP知识原创 2019-02-22 23:56:58 · 147 阅读 · 0 评论 -
urllib模块_cookie模拟登陆
通过urllib 模拟登录原创 2019-02-24 12:14:15 · 220 阅读 · 0 评论 -
xpath,jsonpaht简介及使用
xpath 和 jsonpath 使用原创 2019-02-23 14:03:40 · 546 阅读 · 0 评论 -
urllib.request 模块
urllib.request 模块处理:基本和摘要式身份验证,重定向,cookies等等。1.导入:import urllib.request2.urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None) ...原创 2019-02-23 11:57:00 · 1730 阅读 · 0 评论 -
爬虫——retrying模块-(模拟浏览器的刷新)
就一个方法: 模拟浏览器的刷新:原创 2019-02-23 01:27:57 · 396 阅读 · 0 评论 -
requests模块
Requests模块是一个用于网络访问的模块。目录一、导入二、请求url1.发送无参数的get请求:2.通过params关键字发送带参数的get请求还可以传递一个list给一个请求参数:可以看到确实访问了正确的url。3.发送post请求post请求参数是以data关键字参数来传递的在requests模块中,又加入了json这个关键字参数,可以直接发送j...原创 2019-02-23 01:14:59 · 576 阅读 · 0 评论