写在前面的话:这是自己的第二篇学习的文章了,,第一篇呢,emm...被我设成私密了,因为自己的基础很差,好多地方都是直接抄的书中的原话,不知道那样会不会构成侵权,Whatever,实在不行,到时候都改成私密就好啦。 好,正文开始。
这一章的前两节讲的是HTML,CSS,对于笔者这种上了四年本(ye)科(ji)的人来说,HTML基础还是有一点的,所以只是简单的浏览了下,以后如果有不认识的标签,回头再查一下就好了,毕竟我的目的是要学Python。接下来要简单了解一下JS,因为这个我只是知其大名,知道是可以嵌在HTML中运行的,但是...还是了解下。
1.3JavaScript
JavaScript是一种轻量级的脚本语言,和Python语言是一样的,只不过JavaScript是由浏览器进行解释执行。
如何使用JavaScript呢?主要有直接插入代码和外部引用js文件两种做法
1)直接插入代码,JavaScript代码可以嵌入到网页的任何地方,不过常常都把它放在<head>中,示例如下
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Python学习</title>
<script type="text/javascript">
alert('Hello World!');
</script>
</head>
<body>
Python爬虫
</body>
</html>
2)外部引用js文件。把JavaScript代码放到一个单独的.js文件,然后在HTML中通过<script src='目标文档的URL'></script>的方式来引入js文件
<html>
<head>
<script src="/static/js/jquery.js"></script>
</head>
<body>
python爬虫
</body>
</html>
把JS代码放入一个单独的.js文件利于维护代码,并且多个页面可以各自引用同一份.js文件一般开发中都会采用两种方法结合的方式。
1.JavaScript基本语法
JS严格区分大小写,JavaScript会忽略关键字、变量名、数字、函数名或其他各种元素之间的空格、制表符或换行符。
一条完整的语句如下:
var=1;
最后的分号可以省略,但是不建议省略
注释跟C语言等相同。
2.数据类型和变量
Number类型:JavaScript中不区分整数和浮点数,统一用Number表示。示例如下:
100(整数) 、0.45(浮点数)、1.234e3(科学记数法)、-10(负数)、NaN(无法计算时使用)、Infinity(无限大)、0xff(十六进制)
字符串类型:字符串时以单引号或双引号括起来的任意文本。
布尔值类型:ture、false
数组类型:JavaScript的数组可以包括任意数据类型,如: var arry=[1,2,3.14,'Hello',null,true]。创建数组的另一种方法是通过Array()函数实现,示例:var array=new Array(1,2,3) 数组的元素可以通过索引来访问,索引的起始值为0
对象类型:JavaScript的对象是一组由键-值组成的无序集合,类似Python中的字典,示例如下:
var person={name: 'mfd',age:24,tags:['Python','web','hacker'],city:'Beijing',man:true}。JS对象的键都是字符串类型,值可以是任意数据类型,要获取一个对象的属性,要用“对象变量.属性名”的方式,如:person.name。
3.运算符和操作符
运算符和操作符和其他编程语言很像,比如C语言,相信遇见的时候,是可以认出来的。
4.条件判断
JS使用if(){...} else{...}来进行判断
5.循环
JS的循环有两种,一种是for循环,一种是while循环,for循环常用来遍历数组,他有一个变体是for...in循环,他可以把一个对象的所有属性依次循环出来。
while循环跟C语言相同,分为while(){...}循环和do{...}while(),
6.函数
在JavaScript中,定义函数使用function关键字,使用方法如下:
function add(x,y) {
return x,y;
}
调用函数时,按顺序传入参数即可。JS允许传入任意个参数而不影响调用,因此传入的参数比定义的参数多也没有问题。
1.4 XPath
XPath是一门在XML文档中查找信息的语言,被用于在XML文档中通过元素的属性进行导航。在Python爬虫开发中,经常使用XPath查找提取网页中的信息。
1.Xpath节点
在XPath中,XML文档被作为节点树来对待的,有其中类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档的(根)节点。举例如下:
<?xml version="1.0" encoding="ISO-8859-1" ?>
<classroom>
<student>
<id>1001</id>
<name lang="en"> marry</name>
<age>20</age>
<country>China</country>
</student>
</classroom>
上面的XML文档中的节点例子包括:<classroom>(文档节点)、<id>1001</id>(元素节点)、lang="en"(属性节点)、marry(文本)
节点关系,包括父(Parent)、子(Children)、同胞(Sibling)、先辈(Ancestor)、后代(Descendant)。
- student元素是id、name、age以及country元素的父
- id、name、age以及country元素都是student的子
- id、name、age以及country元素都是同胞节点,拥有相同的父节点
- name元素的先辈是student元素和classroom元素,也就是此节点的父、父的父等
- classroom的后代是id、name、age以及country元素,也就是此节点的子,子的子等。
2.XPath语法
XPath使用路径表达式来选取XML文档中的节点或节点集。
3.XPath运算符
与C语言相的运算符相同
1.5 JSON
JSON是JavaScript对象表示法,用于存储和交换文本信息
2.1 HTTP标准
对于HTTP标准,Cookie方面的知识,大学有学,基本知识是知道的,所以就不在这里写了,期待赶紧进入下一章!爬虫基础!
PS:本文纯是为了坐地铁时,可以查看学习笔记,因为本来就是新手,所以那些刚入门的朋友千万别拿这个作参考,怕是会坑到大家。