![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python爬虫
一抹茶-csdn
碧云引风吹不断,白花浮光凝碗面
展开
-
使用urllib简单的发送请求
urllib 库是python自带的,直接 import from urllib import request url = "http://www.baidu.com" # 访问 url 获取响应数据 resp = request.urlopen(url) print(resp.info()) # 响应头信息 print(resp.geturl()) # 主机地址 print(resp.get...原创 2020-04-04 16:20:57 · 220 阅读 · 0 评论 -
什么是python爬虫?
1、爬虫 就是给网站发起请求,并从响应中提取数据的自动化程式; 发起请求,获取响应 通过http库,对目标点进行请求。等同于自己打开浏览器,输入地址 常用库:urllib、urllib3、requests 服务器会返回请求的内容,一般是:HTML、二进制文件(视频、音频)、文档、json字符串等 解析内容 寻找自己需要的信息、就是利用正则表达式或者其他工具库提取目标信息 常用库:re、be...原创 2020-04-04 15:39:29 · 282 阅读 · 0 评论