- 博客(7)
- 收藏
- 关注
原创 进程与线程的区别 附加爬取喜马拉雅有声书代码
1.什么是线程? 线程是操作系统能够进行运算调度的最小单位(程序执行流的最小单元)。它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。2.什么是进程? 进程(Process)是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础。在早期面向进程设计的...
2018-08-20 22:11:24 223
原创 雪球----爬取
import requests,jsonfrom day3.xueqiu_mysql import mysql_conn# url = 'https://xueqiu.com/v4/statuses/public_timeline_by_category.json?since_id=-1&max_id=-1&count=10&category=111'url = '...
2018-08-15 23:07:27 339
原创 爬虫----有道翻译
import time,random,jsonfrom tuozhan_all import postimport hashlibdef md5_my(need_str): # 创建md5对象 md5_o = hashlib.md5() sign_bytes = need_str.encode('utf-8') # 更新md5 object的值 md5...
2018-08-14 22:21:21 175
原创 人人网页爬取
from http import cookiejarimport jsonfrom urllib import request,parsecookie_o = cookiejar.CookieJar()header = request.HTTPCookieProcessor(cookie_o)opener = request.build_opener(header)url = 'ht...
2018-08-14 22:19:44 339
原创 爬虫封装代码2
from urllib import request, parsefrom urllib.error import HTTPError, URLError# 保存cookiefrom http import cookiejarclass session(object): def __init__(self): cookie_object = cookiejar.C...
2018-08-14 22:17:02 111
原创 python爬虫封装1
from urllib import request,parsefrom urllib.error import HTTPError,URLErrorimport json# get请求def get(url,headers = None): return urlrequests(url,headers=headers)# post请求def post(url,form=Non...
2018-08-13 21:41:12 353
原创 session与cookie的区别
1、cookie数据存放在浏览器上,session数据放在服务器上。2、cookie不是很安全,别人可以分析存放在本地的cookie并进行cookie欺骗 考虑到安全应当使用session。3、session会在一定时间内保存在服务器上。当访问增多,会比较占用你服务器的性能 考虑到减轻服务器性能方面,应当使用cookie。4、Cookie有大小限制以及浏览器在存cook...
2018-08-13 21:21:01 107
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人