手把手学爬虫第三弹——爬取动态渲染的信息

本文详细介绍了如何使用Ajax、Selenium和Splash技术来获取动态渲染的网页数据,包括分析网页请求、查看请求数据、请求数据、数据清洗和完整代码展示。特别强调了Selenium的安装、使用准备及常用方法,如定位元素,为Python爬虫工程师提供实用技巧。
摘要由CSDN通过智能技术生成
      • 1.分析网页请求
  • 2.查看请求数据

  • 3.请求数据

  • 4.清洗数据

  • 5.完整代码以及效果截图

  • 6.分析总结

  • 三、Selenium爬取动态数据

      • 1.安装Selenium以及浏览器驱动
  • 2.Selenium使用准备

  • 3.Selenium模块常用方法

    • a.定位元素
  • b.鼠标操作

  • c.键盘操作

  • 4.Selenium使用

  • 5.分析总结

  • 四、总结

一、什么是动态渲染信息?

========================================================================

学过网页开发相关的都知道很多网页数据并不是一次就返回全部,需要向服务器发送异步请求获取数据。在爬取此类信息的时候可以在浏览器中分析Ajax和JS请求的数据。本文我将和大家一起学习如何使用Ajax、Selenium和Splash技术获取动态数据。

二、Ajax数据爬取

======================================================================

Ajax是一种新的网页数据交互技术,它可以在页面不刷新、不更改页面链接的情况下与服务器交换数据并更新网页部分内容。

下面我们以原神官网的角色加载为例介绍。

1.分析网页请求

请添加图片描述

2.查看请求数据

这类数据一般会以json格式返回,为了方便查好数据,给大家推荐一个JSON数据在线格式化的网站。JSON在线格式化

请添加图片描述

3.请求数据

分析完请求以及返回的数据之后就可以开始怕取数据了,请求代码展示如下,返回数据正常。

-- coding: utf-8 --

@Time : 2021/9/18 16:03

@Author : KK

  • 26
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
TMS320F28335是德州仪器(TI)推出的一款数字信号处理器(DSP),用于实现各种实时控制和信号处理应用。习DSP需要掌握相关的基本知识和编程技巧。 首先,我们可以通过阅读TMS320F28335的官方文档,即TMS320F28335的PDF手册。该手册详细介绍了DSP的硬件架构、指令集、寄存器和外设等内容。通过仔细阅读和理解手册,我们可以全面掌握DSP的基本结构和工作原理。 其次,我们可以选择一个合适的开发环境,如Code Composer Studio(CCS),这是TI为DSP开发提供的集成开发环境。在CCS中,我们可以创建新的项目并配置编译器和调试器。通过CCS集成的调试功能,我们可以方便地调试和验证自己的DSP程序。 为了更好地习DSP,我们可以按照以下步骤进行实践: 1.了解DSP的基本概念和数原理,如离散傅里叶变换(DFT)、离散时间傅里叶变换(DTFT)等。 2.习DSP的编程语言,如C语言或汇编语言。TI提供了DSP的编程工具包,可以帮助我们编写和调试DSP程序。 3.选择合适的实例或项目来进行实践。可以通过加载预定义的DSP库函数或手动编写代码来实现信号滤波、变换、调制等功能。 4.通过仿真和调试,验证自己的程序是否符合预期。根据调试结果进行修改和改进,直到达到要求。 5.不断习和积累经验,参考相关的书籍和教程,习其他高级的DSP算法和应用。 总之,习DSP需要理论和实践相结合。通过阅读TMS320F28335的官方文档,配置开发环境,习基本概念和编程语言,进行实践和调试,我们可以逐步掌握DSP的原理和应用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值