requests模块

python中原生的一款基于网络请求的模块,功能非常强大,简单便捷,效率极高
作用: 模拟浏览器发请求
requests模块的编码流程
    -指定url
    -发起请求
    -获取响应数据
    -持久化储存(指定储存地址)

环境安装
    pip install requests

set-cookie  响应头 js的运行    (登录后server给的)

cookie  请求头     带着sessionid给server,server判断sessionid是否已登录

request.session()  能自动处理set-cookie中的内容,像浏览器一样,自动存储,发送请求的时候自动携带,但并不是像browser一样将cookie存在文件中,而是内存层面的储存

执行requests.get()的时候,相当于执行了session = requests.session()    session.request(),源码中就有这些东西

代理

代理在requests.get()中的参数是proxies=dict,传入的是一个字典,字典中放代理ip

关于xpath解析不到的标签

这种标签一般是js动态创建的.  (例如video标签),页面源代码里是没有这玩意的,几乎没有网站会直接把video放在页面源代码里. 更很少有会把video的src地址直接铺出来. 

你看到的网页的内容只有两个途径能产生.  一个是页面源代码. 另一个就是js

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值