自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 安全层处理 ssl

以访问12306为例from urllib import request#导入python的ssl模块import ssl#用非认证的上下文环境来替换认证的上下文环境ssl._create_default_https_context=ssl._create_unverified_contexturl="https://www.12306.cn"rsp = request.urlop...

2018-12-19 20:17:21 238

原创 用cookie登录网址 python

1.直接把cookie复制下来,加到headers里面2.http模块包含一些cookie模块,通过他们我们可以自动使用cookie四种Cookiejar:–CookieJar–管理存储cookie,向http请求头添加cookie–cookie存储在内存中,CookieJar回收后cookie将消失–FileCookieJar(filename,delayload=None,po...

2018-12-19 10:41:17 1075

原创 使用Cookie模拟登录网页

from urllib import requestif __name__ == '__main__': url = 'http://www.renren.com/968464481/profile' headers ={ "Cookie":"anonymid=jptoy3zhtckz93; depovince=HUN; _r01_=1; JSESSIONI...

2018-12-18 20:03:39 816

原创 python matplotlib pie图

画饼图import matplotlib.pyplot as plt'''参数:'''pie(x, explode=None, labels=None, colors=('b', 'g', 'r', 'c', 'm', 'y', 'k', 'w'), autopct=None, pctdistance=0.6, shadow=False, labeldistance=...

2018-12-03 11:17:42 1768

原创 python 爬虫 定向爬取技术

# -*- coding: utf-8 -*-import reimport urllib.requestdef getcontent(url): #更改自己的User-Agent,让所爬取网页以为自己是浏览器访问 headers = ("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 ...

2018-10-18 21:59:47 230

原创 Python 爬虫 更改User-Agent

from urllib import request,errorif __name__ == '__main__': url ="http://www.baidu.com" try: #使用head方法进行伪装 #headers={} #headers['User-Agent']='Mozilla/5.0 (iPad; U; CPU...

2018-10-17 21:49:25 1005

原创 python 正则表达式 简介

python 正则表达式 简介1.正则表达式:描述字符串排列的一套规则2.可以使用正则表达式提取出所有满足规则的字符串3.在python中使用re模块是实现在python正则表达式的功能正则表达式的基础知识:1.原子2.元字符3.模式修正原子 :原子是正则表达式中最基础的组成单位,每个正则表达式中至少包含一个原子1.普通字符做原子import repattern = "gag...

2018-10-17 11:35:55 2874 1

原创 使用代理访问百度网站 ProxyHandler python 爬虫 入门

使用代理访问百度网站 ProxyHandler python 爬虫'''使用代理访问百度网站-ProxyHandler处理(代理服务器) -使用代理服务器,是爬虫的常用手段 -获取代理服务器的地址: -www.xicidaili.com -www.goubanjia.com -代理用来隐藏真实访问中,代理也不允许频繁访问某一固...

2018-10-16 16:39:04 2349

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除