python3.8爬虫_python3.8.1 入门基础学习 之【 BeautifulSoup 基础学习,python爬虫爬百度搜索右边 搜索热点 数据】...

第一、下载安装 BeautifulSoup

pip install beautifulsoup4

第二、编写爬虫爬百度搜索右边热点数据

import requests

from bs4 import BeautifulSoup

"""

python3.8.1 入门基础学习 之 【 BeautifulSoup 基础学习,python3 爬虫爬百度搜索右边 搜索热点 数据】

"""

def fistRequestAdnBs4():

# 设置请求头

headers = {

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.79 Safari/537.36'

}

# 设置URL,设置headers,设置请求超时时间5秒

r = requests.get('https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=2&tn=baiduhome_pg&wd=%E4%B8%89%E4%BA%91%E6%97%B6%E5%85%89&rsv_spt=1&oq=pip%2520install%2520request&rsv_pq=9541ec1100013a70&rsv_t=58b7oO00R1U4nVBJ1beD2LdZqHA%2B9Net20g9dO%2Ffs3T5x%2BM7nLjmsDJ1hkfFDMtakJaX&rqlang=cn&rsv_enter=1&rsv_dl=tb&inputT=5842&rsv_sug3=32&rsv_sug1=23&rsv_sug7=100&rsv_sug2=0&rsv_sug4=9553',

headers=headers, timeout=5)

if r.ok: # 请求是否成功

soup = BeautifulSoup(r.content,"html.parser") # 解析HTML

table = soup.find("table") # 获取百度搜索页面最右边的 搜索热点 列表

lista = table.tbody.find_all("a") # 获取热点链接

for child in lista: # 循环遍历 热点列表数据集合

print(child.string) # 打印热标签内容

else: # 请求出错

print("请求失败")

if __name__ == '__main__':

fistRequestAdnBs4()

4、学习更多更详细的 BeautifulSoup 使用文档,请查阅官方文档

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值