python爬虫

python爬虫

安装jupyter

控制台输入pip install jupyter

注意:一般会报错 不能直接安装

安装Python 3.9并尝试安装jupyter笔记本后,我遇到类似的问题。您需要转到以下URL:https : //visualstudio.microsoft.com/visual-cpp-build-tools/ //前面的地址输入到浏览器中 然后按回车 926并下载Microsoft Build工具(只需单击蓝色的大按钮)。下载并执行安装程序后,将为您提供各种选择:Microsoft C ++构建工具是其中之一。单击复选框,然后选择安装。安装完成后,您将需要重新启动计算机。在那之后运行pip再次安装jupyter,一切都应该没问题。

如果上面的方法不能直接安装 使用中国清华大学的镜像

pip install -i http://pypi.tuna.tsinghua.edu.cn/simple

打开方式 进入指定的文件之后命令行输入jupyter notebook即可浏览器中打开

注意:jupyter内置markdown编辑器模式 按M就变成了markdown模式 可以随时笔记

1.requests 安装

pip install requests

import requests  //引入库
r = requests.get('http://www.baidu.com')
r.status_code  //查看状态码  如果是200 表示 获取成功
r.encoding = 'utf-8'  
r.text  //表示打印获取的内容


1.2、 Requests库的7个主要方法

image-20201023214051187

2、requests.get(url)//

获取一个网页的数据最快的方法

image-20201023214303036

image-20201023214326731

image-20201023214412516

Response对象的属性

image-20201023214627340

image-20201023215037202

image-20201023215929289

当我们encoding不能解析代码的时候我们要用apparent_encoding来解析这个更准确一些 因为这个方法是实实在在的去网页里的内容解析的

理解Requests库的异常

image-20201023220239970

HTTP协议

image-20201023220903200

image-20201023220955489

HTTP协议对资源的操作

image-20201023221110842

image-20201023221409858

image-20201023221434097

image-20201023221507510

image-20201023221528298

Requests库主要方法解析

image-20201023221740527

image-20201023223000944

爬虫实例爬取京东页面

image-20201024172203740

image-20201024202906333

image-20201024203426016

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值