《python》002 网络爬虫

python3.6 安装 Scrapy 1
安装 2
安装直接看这个!!最简单!!

Request使用大全
简单了解
爬取网站
趣头条爬取
网络爬虫实例
小甲鱼零基础python 视频
小甲鱼视频 爬虫篇

对象 = obj
一、import urllib.request
urllib = URL +lib(库)
URL: 协议 + 域名系统/IP地址 + 资源具体地址
1、obj.urlopen( url 参数 / Request对象 ) 返回类文件对象
obj = urllib.request.urlopen(req/ url) 是将服务器从网页上获取的过程,url为字符串地址
req/ url = urllib.request.Request(url)
2、obj. read() 读取网站信息,返回JSon格式字符串
obj.geturl() 返回请求的 URL
obj.getcode() 返回HTTP状态码
obj.info() 返回 httplib.HTTPMessage
3、新的 obj.decode(‘utf-8’) 将utf-8 解码为 Unicode
obj.encode(‘utf-8’)

4、urllib.parse.urlencode(data).encode(‘utf-8’)① 独立模块解析 --> 作 urlopen()第二个参数②将Unicode重新编码

5、 Json 模块: import json
Json.loads(字符串) 返回解析内容,使内容成为易读的(字典形式)

6、head: 代理
obj.add_header(key, value) 动态追加修改浏览器

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值