bairong7641-CSDN博客

转载关于scrapy

Scrapy安装1，Pip install wheel 2，pip install 复制路径+文件名Twisted-18.7.0-cp36-cp36m-win_amd64.whl3，Pip install scrapyhttps://germey.gitbooks.io/python3webspider/content/1.8.2-Scrapy%E7%9A%84%E5%A...

2018-08-23 21:32:00 111

转载关于有道翻译

import requestsimport json# 1. urlurl = 'http://fanyi.baidu.com/sug'# 2. form/ data/ bodydef translate(kw): form = { 'kw': kw } # # 2.1 字典转换成str # form_str = parse.urlencode(fo...

2018-08-23 21:26:00 115

转载关于正则匹配

import re #正则的包line = "huang123"match_res = re.match('h', line)#以 h 开头匹配match_res = re.match('h.', line)#以h开头后面跟着一个字符line = 'h\n'match_res = re.match(r'h\n', line)line = 'h2k'matc...

2018-08-23 21:25:00 93

转载关于人人网的form查找和打印

from lianxi import sessionimport json# urlurl = 'http://www.renren.com/ajaxLogin/login?1=1&uniqueTimestamp=201872158696'# formform = { 'email': '17744501914', 'icode': '', 'origURL:h...

2018-08-14 21:55:00 87

转载保存cookie状态封装

from urllib import request, parsefrom urllib.error import HTTPError,URLError#保存cookiefrom http import cookiejarclass session(object): def __init__(self): cookie_object = cookiejar.Cooki...

2018-08-14 21:54:00 109

转载 gat和post封装代码和爬虫的5个步奏

1了解需求2根据需求找网站3请求4获取5存储from urllib import request, parsefrom urllib.error import HTTPError, URLErrordef get(url, headers=None): return urlrequests(url, headers=headers)　　#必须写headers，因为按顺序走会form...

2018-08-13 22:55:00 170

转载 gat和post封装代码

from urllib import request, parsefrom urllib.error import HTTPError, URLErrordef get(url, headers=None): return urlrequests(url, headers=headers)　　#必须写headers，因为按顺序走会formdef post(url, form, he...

2018-08-13 22:52:00 254

转载 session和cookie的区别是什么，他们都是什么.

Session是存储在服务器端的，Cookie是存储在客户端的。Cookie是客户端保存用户信息的一种机制，用来记录用户的一些信息。如何识别特定的客户呢？cookie就可以做到。每次HTTP请求时，客户端都会发送相应的Cookie信息到服务端。它的过期时间可以任意设置，如果你不主动清除它，在很长一段时间里面都可以保留着，即便这之间你把电脑关机了。Session是在无状态的HTTP...

2018-08-13 20:02:00 87