#博客园:https://www.cnblogs.com/
爬取帖子名 和 对应内容(图片可以跳过)
#获取每页链接的模块
n=1
headers={
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.87 Safari/537.36'}
for k in range(200):
try:
print('正在爬取第%s页' % (k + 1))
url1='https://www.cnblogs.com/#p{}'.format(k+1) #获取每个网页链接
r = requests.get(url1,headers=headers).text