from urllib import request
import re
#定义url
page=100
url='https://tieba.baidu.com/f?kw=%B6%CE%D7%D3&fr=ala0&tpl=5&dyTabStr=MCw2LDIsNCw1LDMsMSw4LDcsOQ%3D%3D'+str(page)
#
try:
headers={'User-Agent':' Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.74 Safari/537.36'}
#定义请求。转入请求头
req=request.Request(url,headers=headers)
#打开网页
resp=request.urlopen(req)
#打印响应码
# print(resp.read().decode('utf-8'))
content=resp.read().decode('utf-8')
print(content)
#写正则表达式
#<a rel="noopener"> 具体的东西直接写出
#.*?匹配没用的数据
#(.*?) 匹配有用的数据分组
#\s 空格
pattern=re.compile('<a rel="noopener".*?title=(.*?)\s.*?>(.*?)</a>')
#pat