python爬取百度标题_python3的requests库爬取百度搜索关键字python的标题信息

该博客介绍了如何在Python3.7环境下使用requests库爬取百度搜索'python'的关键字结果,并利用BeautifulSoup解析HTML,提取h3标签中的标题信息,最后将这些标题保存到Excel表格中。
摘要由CSDN通过智能技术生成

#本代码作用:在python3.7环境中,在百度首页输入python,并打印出来当前页面的源代码,并将查询到的python标题存入Excel数据

#代码如下:

#本代码是在python3.7环境下,使用requests库爬取百度源代码

#1、导入相应的模块,requests库是第三方库,需要在cmd里pip install requests

import requests

from bs4 import BeautifulSoup

import re

import pandas as pd

#2、对网站进行get请求

url="https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=python&rsv_pq=c975914300115949&rsv_t=e7f3%2FJ8sovjmaqT%2B6p6ID4KVYbFRyG9dPQjqKtszA7eNO7jE0ynUBwuzYek&rqlang=cn&rsv_enter=1&rsv_dl=tb&rsv_sug3=3&rsv_sug1=3&rsv_sug7=101&rsv_sug2=0&inputT=2503&rsv_sug4=4616&rsv_sug=2"

#上面这行代码是在百度首页查询python关键字,将此网站赋值给url

headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:69.0) Gecko/20100101 Firefox/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值