网络爬虫
ChinaXGS
这个作者很懒,什么都没留下…
展开
-
UrlLib基础
urllib的包含的模块 urllib中包括了四个模块,包括: 模块名 备注 urllib.request 可以用来发送request和获取request的结果 urllib.error 包含了urllib.request产生的异常 urllib.parse 用来解析和处理URL urllib.robotparse 用来解析页面的robots.txt文件 使用url...原创 2018-11-30 20:00:09 · 308 阅读 · 0 评论 -
python网络爬虫实列——站长之家url解码编码
爬虫实列——站长之家url解码编码 利用urllib可以做一些网页在线翻译,在线解码之类的实列。 1. 这是网站 2.找到所需要的请求头文件 找到请求网址,明确请求方法(详情请百度get请求与post请求的区别)。 3.伪造POST请求 post请求发送的数据是以键值对的方式发送。 这里可以看到所需要发送的键值对。 data = {"content": sty, "chars...原创 2018-11-30 20:23:56 · 882 阅读 · 0 评论