Python案例快速入门之二:从页面抓取数据

本章将直接开始一个从CSDN抓取数据的小例子。

  1. 新建如下文件
    在这里插入图片描述
  2. 输入下面代码,从csdn抓取菜单列表
import requests
from lxml import etree

url="https://www.csdn.net/"
header = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36"}
pre={'User-agent':'Mozilla/5.0'}
 
html = requests.get(url, headers=header).text
list = etree.HTML(html)
lis = list.xpath('//div[@class="host-move"]/ul/li')
try:
    for oneSelector in lis:
        title = oneSelector.xpath("a/text()")[0]
        print(title)
        
except  Exception as e:
    print("获取失败:{}".format(e))
  1. 如果鼠标移动到requests时,出现如下错误
    在这里插入图片描述
  2. 在终端中输入下面语句,安装需要的包
 pip install requests
  1. 如果lxml的包也没有安装,在终端中输入下面语句,进行安装
pip install lxml
  1. Ctrl+F5 执行程序,或者单击菜单【运行】-》【以非调试模式运行】

  2. 显示如下结果,我们就抓取到了csdn的菜单项,完成了我们的第一个非常非常简单的数据抓取案例
    在这里插入图片描述

推荐视频 — Spring 全家桶

轻松搞定Spring全家桶—初识篇

基础篇:Spring MVC快速开发

核心篇:SpringBoot快速入门

核心篇:深入浅出SpringCloud+SpringData

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

IT职涯

你的鼓励将是我最最大的创作动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值