- 博客(8)
- 收藏
- 关注
转载 关于scrapy
Scrapy安装1,Pip install wheel 2,pip install 复制路径+文件名Twisted-18.7.0-cp36-cp36m-win_amd64.whl3,Pip install scrapyhttps://germey.gitbooks.io/python3webspider/content/1.8.2-Scrapy%E7%9A%84%E5%A...
2018-08-23 21:32:00 111
转载 关于有道翻译
import requestsimport json# 1. urlurl = 'http://fanyi.baidu.com/sug'# 2. form/ data/ bodydef translate(kw): form = { 'kw': kw } # # 2.1 字典转换成str # form_str = parse.urlencode(fo...
2018-08-23 21:26:00 115
转载 关于正则匹配
import re #正则的包line = "huang123"match_res = re.match('h', line)#以 h 开头匹配match_res = re.match('h.', line)#以h开头后面跟着一个字符line = 'h\n'match_res = re.match(r'h\n', line)line = 'h2k'matc...
2018-08-23 21:25:00 93
转载 关于人人网的form查找和打印
from lianxi import sessionimport json# urlurl = 'http://www.renren.com/ajaxLogin/login?1=1&uniqueTimestamp=201872158696'# formform = { 'email': '17744501914', 'icode': '', 'origURL:h...
2018-08-14 21:55:00 87
转载 保存cookie状态封装
from urllib import request, parsefrom urllib.error import HTTPError,URLError#保存cookiefrom http import cookiejarclass session(object): def __init__(self): cookie_object = cookiejar.Cooki...
2018-08-14 21:54:00 109
转载 gat和post封装代码和爬虫的5个步奏
1了解需求2根据需求找网站3请求4获取5存储from urllib import request, parsefrom urllib.error import HTTPError, URLErrordef get(url, headers=None): return urlrequests(url, headers=headers) #必须写headers,因为按顺序走会form...
2018-08-13 22:55:00 170
转载 gat和post封装代码
from urllib import request, parsefrom urllib.error import HTTPError, URLErrordef get(url, headers=None): return urlrequests(url, headers=headers) #必须写headers,因为按顺序走会formdef post(url, form, he...
2018-08-13 22:52:00 254
转载 session和cookie的区别是什么,他们都是什么.
Session是存储在服务器端的,Cookie是存储在客户端的。Cookie是客户端保存用户信息的一种机制,用来记录用户的一些信息。如何识别特定的客户呢?cookie就可以做到。每次HTTP请求时,客户端都会发送相应的Cookie信息到服务端。它的过期时间可以任意设置,如果你不主动清除它,在很长一段时间里面都可以保留着,即便这之间你把电脑关机了。Session是在无状态的HTTP...
2018-08-13 20:02:00 87
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人