Requests库的使用-爬取HTML页面

最新推荐文章于 2022-05-08 15:50:25 发布

透晓西桥

最新推荐文章于 2022-05-08 15:50:25 发布

阅读量729

点赞数

分类专栏： # Python爬虫

本文链接：https://blog.csdn.net/Yang_Cpp/article/details/107167461

版权

Python爬虫专栏收录该内容

12 篇文章 3 订阅

订阅专栏

def get_page(url):
    try:
        header = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36'}
        r = requests.get(url, headers=header)
        r.raise_for_status()
        print(r.text)
    except:
        print("出现异常")

if __name__ == '__main__':
    url = input("请输入网址: ")
    get_page(url)
# input: https://www.baidu.com
# output: html页面内容

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

透晓西桥

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Requests库的使用-爬取HTML页面

def get_page(url): try: header = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36'} r = requests.get(url, headers=header) r.raise_for_status()
复制链接

扫一扫