自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 浅谈进程和线程

                                           进程(process)和线程(thread)进程和线程都是一个时间段的描述,是CPU工作时间段的描述。不过是颗粒大小不同:    1.计算机的核心是CPU,承担所有计算任务,就像一座工厂。假定工厂的电力有限,一次只能给一个车间使用。也就是说,一个车间开工的时候,其他车间都必须停工。背后的含义就是说单个CPU...

2018-08-20 19:32:58 229

原创 雪球

# 首先导入包import jsonimport requests# 因为不能访问 所以定义一个headers headers = { 'Cookie': 'aliyungf_tc=AQAAAODXGFvpEAQAUhVFeWRkaVV0fMTp; xq_a_token=584d0cf8d5a5a9809761f2244d8d272bac729ed4; xq_a...

2018-08-16 14:02:06 576

原创 笔记----0815

0.知识点简要回顾一.爬虫的过程1.需求,确定有需求的人到底想要什么2.根据需求寻找网站3.网站数据获取到本地(urllib,requests)4.定位数据(正则,xpath,json)5.存储(数据库,磁盘,网络发送)(mysql,redis,文件)6.反爬虫:其他公司不想让我们获取他们的数据,通过HTTP请求头,请求频率(通过判断是不是同一个ip,投...

2018-08-15 20:58:17 164

原创 人人网登陆 二

from tuozhan_all import sessionimport json# urlurl = 'http://www.renren.com/ajaxLogin/login?1=1&uniqueTimestamp=2018721441132'# formform = { 'email': '15110048913', 'icode': '', ...

2018-08-14 20:55:58 355

原创 人人网登陆 一

#导入封装文件(爬虫基础:函数封装(更新一))from tuozhan_all import post, getimport jsonfrom urllib import request, parse# 保存cookiefrom http import cookiejar# 通过对象保存cookiecookie_object = cookiejar.CookieJar()...

2018-08-14 20:44:16 3053

原创 爬虫基础:函数封装(更新一)

# 导入包,模块from urllib import request, parsefrom urllib.error import HTTPError, URLError#保存cookiefrom http import cookiejar #对于有登录是  所将用户记录下来  class session(object):    def __init__(self):     ...

2018-08-13 20:58:44 506

原创 1.session,cookie是什么以及两者之间的联系和区别

cookie(实际上是一小段文本信息): 实际上是一小段文本信息客户端发送请求,服务器记录用户状态并使用response向客户端发送一个cookie。客户端会把cookie保存起来。当浏览器再请求该网站时,浏览器会把请求的网址连同该cookie一同提交给服务器。服务器检查该cookie以此辨认用户状态。 若设置了过期时间,浏览器就会把cookie保存到硬盘上,关闭后再次打开浏览...

2018-08-13 20:12:44 358

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除