网络爬虫摘文-爬虫开发基础-1.5-JavaScript

JavaScript是一种直译式脚本语言, 是一种动态类型、弱类型、基于原型的语言,内置支持类型。
它的解释器被称为JavaScript引擎,为浏览器的一部分,广泛应用于客户端的脚本语言,最早在HTML网页上使用,用来给HTML网页增加动态功能。

JavaScript脚本语言同其他语言一样,有自身的基本数据类型、表达式和算术运算符及程序的基本框架。

JavaScript提供了4种基本的数据类型和两种特殊的数据类型来处理数据和文字,变量提供存放信息的地方,表达式则可以完成较复杂的信息处理。

有时候分析网站需要理解某些JavaScript的功能,如某些特殊的数据会存放在JavaScript中,以12306全国站点为例:
在这里插入图片描述
从图中可以看出来,不同的站点有对应的英文字母,代表站点的编码信息,JavaScript储存数据主要使用变量的形式。

JavaScript还能根据用户触发某些事件对用户的操作进行加工处理。例如用户登录信息设置加密处理,原理是先对用户提交的信息做加密处理,然后发送请求到服务器,这一系列事件有JavaScript独立完成。要用爬虫实现该功能,就要分析JavaScript如何执行整个用户登录过程。

下面通过分析一个简单的例子,来进一步了解JavaScript事件的触发原理:
在这里插入图片描述

JavaScript事件的触发过程
(1)HTML根据< form>< /form>标签相应的生成一个表单
(2)当用户在表单输入内容后,单击提交按钮,就会触发< form>< /form>表单里所指向的validateFore()方法,执行相应的JavaScript代码
(3)validateForm()会判断输入的值是否为空。如果输入的值为空,就会提示输入名字:若输入的值不为空,则会提示“提交成功”

·
·
·
·

·文章摘选自《实战Python网络爬虫》,仅用于个人学习笔记。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值