Python爬虫入门实例一之淘宝商品页面的爬取

最新推荐文章于 2024-03-22 18:40:32 发布

我敲的贼快

最新推荐文章于 2024-03-22 18:40:32 发布

阅读量3k

点赞数 3

分类专栏：爬虫实例文章标签： python 爬虫编程语言

本文链接：https://blog.csdn.net/weixin_44578172/article/details/109301305

版权

爬虫实例专栏收录该内容

12 篇文章 23 订阅

订阅专栏

文章目录

1.爬取原界面

今天给大家介绍第一个爬虫小例子，使用requests库爬取淘宝商品信息，首先想要爬取的内容如下图。
在这里插入图片描述

2.代码解析

使用交互环境给大家带来代码解析

（1）首相导入requests库，然后将网页url地址保存到变量中

在这里插入图片描述
（2）使用requests库的get()方法得到地址，并用r.raise_for_status函数判断是否连接正常，正常则返回200，其他值则为错误

在这里插入图片描述
（3）将从网页内容中解析出的编码方式赋值给r.encoding，之后以字符串的方式将爬取内容输出

在这里插入图片描述
（4）输出内容如下

在这里插入图片描述

3.完整代码

import requests
url = "https://item.taobao.com/item.htm?id=625588903252&ali_refid=a3_430673_1006:1123185872:N:5Li%2BA5zGU7Aqz5docyZENQ%3D%3D:6620fa14ff820a1fe33c8d19bbbd1752&ali_trackid=1_6620fa14ff820a1fe33c8d19bbbd1752&spm=a2e15.8261149.07626516002.2"
try:
    r = requests.get(url)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text)
except:
    print("爬取失败")

所有编程实践中，代码最终的效果固然很重要，但更重要的还是代码的稳定性，所以使用try except代码块捕获异常

本篇完，如有错误欢迎指出~

引用源自

中国大学MOOC Python网络爬虫与信息提取
https://www.icourse163.org/course/BIT-1001870001

我敲的贼快

关注

3
点赞
踩
14

收藏

觉得还不错? 一键收藏
打赏
3
评论
Python爬虫入门实例一之淘宝商品页面的爬取

爬虫入门小例子之爬取淘宝商品信息
复制链接

扫一扫

专栏目录