使用urllib爬取网页（1百度贴吧）

最新推荐文章于 2021-11-25 21:54:43 发布

missa_emperor

最新推荐文章于 2021-11-25 21:54:43 发布

阅读量461

点赞数

文章标签： python url

本文链接：https://blog.csdn.net/missa_emperor/article/details/104904412

版权

import urllib.request
import urllib.parse
url='https://tieba.baidu.com/f?'
word=input("请输入你要爬取的网页关键词：")
kw={'kw':word}  
kw=urllib.parse.urlencode(kw)  #转换成url编码
new_url=url+kw #拼接成完整的url
headers={'user-agent':' Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36'}
req=urllib.request.Request(new_url,headers=headers)  #通过request类构造一个带有各类参数的请求对象
r=urllib.request.urlopen(req)
html=r.read().decode('UTF-8')
#使用read()方法读取获取到的网页内容，用utf-8格式进行编码
print(html)

输出内容展示

在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

missa_emperor

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
使用urllib爬取网页（1百度贴吧）

import urllib.requestimport urllib.parseurl='https://tieba.baidu.com/f?'word=input("请输入你要爬取的网页关键词：")kw={'kw':word} kw=urllib.parse.urlencode(kw) #转换成url编码new_url=url+kw #拼接成完整的urlheaders={'us...
复制链接

扫一扫