import requests
import re
# re.DOTALL
可以匹配自动换行的数据headers={
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36'
}
R=requests.get('https://tieba.baidu.com/f?kw=%E5%AD%99%E7%AC%91%E5%B7%9D',headers=headers)
print(re.findall(""".*?""",R.content.decode(),re.DOTALL))
# R.text.find('')#
查找到当前字符串所在的位置headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/104.0.0.0 Safari/537.36'}
R=requests.get('https://36kr.com/',headers=headers)
url1=re.findall(""".*?""",R.text)
url2=['https://36kr.com'+i for i in url1]
print(url2)
title=re.findall("""(.*?)""",R.text)
print(title)
python爬虫
最新推荐文章于 2024-09-27 10:11:28 发布