自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Python爬虫基础数据提取方法之json

json 1.数据交换格式,看起来像Python类型(列表,字典)的字符串 2.使用json之前需要导入 3.json.loads 把json字符串转化为python类型 json.loads(json字符串) 4.json.dumps 把python类型转化为json字符串类型 json.dumps({}) json.dumps(ret1,ensure_ascii=False.indent=2)...

2020-05-06 09:01:29 592

原创 Python format格式化函数及括号的区别

它通过{}和:来代替传统%方式 1.使用位置参数 要点:从以下例子可以看出位置参数不受顺序约束,且可以为{},只要format里有相对应的参数值即可,参数索引从0开,传入位置参数列表可用*列表 >>>"My name is{},age{}".format("toto",20) My name is toto,age 20 >>>"My name i...

2020-05-04 21:17:22 1051

原创 Python爬虫基础(二)处理cookies相关请求

接着上回说的requests相关知识进行补充 使用超时参数 requests.get(url,headers=headers,timeout=3) 3秒内必须返回,否则会报错 retrying模块学习 1.安装 pip install retrying 2.举例内联代码片。 import requests from retrying import retry def _par...

2020-04-30 18:03:08 276

原创 Python爬虫基础(一)requests学习

requests安装 电脑搜索栏输入cmd进入命令提示符填入 pip install requests 安装完成 调用 import requests 发送get,post请求 1.response=requests.get(url) 发送get请求,url地址才能响应 2.response=requests.post(url,data={请求体的字典}) 发送post请求 re...

2020-04-29 20:05:08 126

原创 Python爬虫基础 了解HTTP,HTTPS知识

HTTP:超文本传输协议(http,hypertext transfer protocol)是互联网上应用最为广泛的一种网络协议 1.以明文的形式传输(不安全) 2.效率更高 HTTPS:HTTP+SSL 这里的SSL是指安全套接字层 1.传输之前数据先加密,之后解密才能获取内容 2.效率比较低,安全可靠性较高 HTTP协议的请求 1.请求行 2.请求头 。User-Agent:用户代理:对方服务...

2020-04-29 19:20:47 116

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除