Python爬虫之requests库（1）

最新推荐文章于 2024-07-08 00:01:13 发布

锦鲤@me

最新推荐文章于 2024-07-08 00:01:13 发布

阅读量184

点赞数 1

文章标签： python

本文链接：https://blog.csdn.net/qq_50542033/article/details/116237716

版权

requests库的使用

文章目录

爬取网页的通用代码框架
1、idle中如何爬取？
2、脚本文件中如何爬取？

爬取网页的通用代码框架

提示：以下是本篇文章正文内容，下面案例可供参考

1、idle中如何爬取？

代码如下（示例）：

>> import requests
>>> r=requests.get("https://item.jd.com/10027415867924.html")
>>> r.status_code
200
>>> r.encoding
'UTF-8'
>>> r.text[:1000]

2、脚本文件中如何爬取？

代码如下（示例）：

import requests
def getHTMLText(url):
    try:
        r=requests.get(url,timeout=30)
        r.raise_for_status()
        r.encoding=r.apparent_encoding
        print(r.text[:1000])
    except:
        print("产生异常")
url="https://www.2345.com/?kbox73713266"
getHTMLText(url)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

锦鲤@me

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Python爬虫之requests库（1）

requests库的使用文章目录爬取网页的通用代码框架1、idle中如何爬取？2.脚本文件中如何爬取？爬取网页的通用代码框架提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考1、idle中如何爬取？代码如下（示例）：>> import requests>>> r=requests.get("https:
复制链接

扫一扫