爬虫学习的第一天（requests简单的框架--初阶）

最新推荐文章于 2024-02-18 17:32:58 发布

「已注销」

最新推荐文章于 2024-02-18 17:32:58 发布

阅读量165

点赞数

分类专栏：爬虫文章标签：爬虫 python

本文链接：https://blog.csdn.net/weixin_43093322/article/details/122154656

版权

爬虫专栏收录该内容

11 篇文章 0 订阅

订阅专栏

import requests #调用requests库
def getHTML(url):
	try:                         #将爬取网页中出现的错误直接try，是爬取正常运行
		r = requests.get(url)
		r.raise_for_status       #判断是否能链接上
		r.encoding = r.apparent_encoding   #获取编码方式，网页页面内容可能与标题不一样
		return r.text
	except:
		return "爬取失败"
def main():
	if __name__ == '__main__':   #是指在调用requests库时，requests中的代码块不被执行
		url = input("请输入爬取的网站地址:")
		print(getHTML(url))
main()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

「已注销」

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫学习的第一天（requests简单的框架--初阶）

import requests #调用requests库def getHTML(url): try: #将爬取网页中出现的错误直接try，是爬取正常运行 r = requests.get(url) r.raise_for_status #判断是否能链接上 r.encoding = r.apparent_encoding #获取编码方式，网页页面内容可能与标题不一样 return r.text except: retur
复制链接

扫一扫