python_爬虫进度_练习1

爬取美化网站中鼠标指针美化里面的所有鼠标美化的名字:

from bs4 import BeautifulSoup
import requests

for i in range(16):
    # shubiao_yuandaima = requests.get(f"https://zhutix.com/tag/cursors/page/{i + 1}")
    # print(f"查看网页是否允许访问: {shubiao_yuandaima.status_code}")  # 查看能否访问,返回200,表示能
    shubiao_yuandaima = requests.get(f"https://zhutix.com/tag/cursors/page/{i + 1}").text
    # print(shubiao_yuandaima)  # 查看源代码

    jiexi = BeautifulSoup(shubiao_yuandaima, "html.parser")  # 解析源代码,获得实例

    # 使用findAll()方法,获取指定的元素,并赋值
    need_elements = jiexi.findAll("div", attrs={"class": "post-info"})
    # print(need_elements)  # 查看找到的指定内容,由[]将查找到的指定内容包围
    print(f"第{i + 1}页: ")  # 输出多少页
    b = 1  # 给每页鼠标加个序号
    for need_element in need_elements:  # 这个need_elements 是个列表,里面是div标签中的内容
        # print(need_element)  # 查看need_elements中的每项元素
        need_el = need_element.findAll("h2")  # 将列表里面的元素取出来,并再次使用findAll()方法继续提取所需内容,
        # print(need_el)  # 查看列表中提取出来的元素
        for need_el_1 in need_el:
            print(f"{b}.{need_el_1.string}")
            b += 1  # 递增
            # 总结:  先使用requests.get()方法,找到网页HTML的text文件.
            #       然后使用BeautifulSoup()函数,括号中第一个参数指定HTML的text文件,第二个参数指定解析器(因为,这个BeautifulSoup库有很多针对网页的内容
            #       然后将BeautifulSoup返回的实例,使用findAll()方法,找到指定的内容. 括号中第一个参数填网页标签,第二个参数填对应网页class类的字典
    print()

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值