urllib
冥想10分钟大师
持续的坚持学习才是真
展开
-
Python爬虫urllib之cookie保持登录状态
post请求,发送账户信息data,requset里面data必须为bytes格式 data = { #填写自己的email和密码 'email':'*********', 'password':'*******' } #把data信息编写为机byte形式 data = parse.urlencode(data).encode...转载 2019-03-18 22:44:58 · 1584 阅读 · 3 评论 -
Python爬虫urllib之读取cookie文件不输密码访问网站
在From Data查看需要提交的data信息,构建data信息log:pwd:wp-submit: 登录redirect_to: http://date.jobbole.com/wp-admin/testcookie: 1 data = { "log": "*******", "pwd": "******", "rememberme...原创 2019-03-18 22:52:33 · 433 阅读 · 0 评论 -
Python爬虫urllib之百度翻译json数据解析
很简单from urllib import request, parseimport json# post传输翻译词 girlbaseurl='https://fanyi.baidu.com/sug'data={'kw': 'girl'}print(type(data))data=parse.urlencode(data).encode('utf-8')rsp=request....原创 2019-03-26 21:06:04 · 414 阅读 · 1 评论 -
Python爬虫urllib之猫眼电影正则
猫眼电影 '''利用正则爬取猫眼电影-url:http://maoyan.com/board-把电影信息拿下来分析-一个电影信息在dd的单元内-找到每一个dd,用re按个查找需要的信息'''#1 把网页信息爬取下来from urllib import requesturl = 'http://maoyan.com/board'rsp = request.urlopen(u...原创 2019-03-23 23:24:05 · 320 阅读 · 0 评论 -
Python爬虫urllib之模拟百度搜索
HTTP状态码分类分类描述1**信息,服务器收到请求,需要请求者继续执行操作2**成功,操作被成功接收并做处理3**重定向,需要经一部的操作已完成请求4**客户端错误,请求包含语法错误或无法完成请求5**服务器错误,服务器在处理请求过程中发生了错误HTTP请求方式-GET-POST...原创 2019-03-15 16:30:12 · 1012 阅读 · 0 评论