网页脚本编程学习笔记
1、配置
此处以火狐浏览器为例:
1)、
打开web控制台,调出查看器(用于查看该网页的HTML源代码)、控制台(编写控制代码,可以实时操作,显示运行结果、报错,类似于MATLAB的命令框)。
2)、
先在控制台学习各函数的功能、用法,然后在此基础上编写脚本。(初学者)
2、获取需要的网页源代码标签
1)、标签的格式:
<标签名, id=“id_name”, class=“class_name”, name=“myname”, 其他属性=“属性值”></标签名>
2)、函数
getElementById(“id_name”): id即为标签中的id值,选择含有指定id值的标签。
getElementsByTagName(“标签名”):选择含有指定标签名的标签。
getElementsByClassName(“class_name”):选择含有指定类名的标签。
注意:以上函数返回一个标签,但属性值可能有相同的,所以常用:
getElementsByTagName(“标签名”)[i]
若函数得到n个标签名一致的标签,则[i]表示取第i个标签(类似于数组,i=0,1,2、、)
getElementsByName(“myname”):选择含有指定name值的标签,它返回的是数组(多个标签),而不是一个元素,不同于上面的函数。
getElementsByTagNameNS(“x1”,“x2”):选择有指定名称和命名空间的所有元素,
x1:要搜索的命名空间名称( “" 匹配所有的标签)。
x2:要搜索的标签名( "” 匹配所有的标签)
3)、代码
var content
content = document.getElementById("id");
功能:获取标签内容->content
document:取网页内容。
getElementByName()可以换成上述其它函数。
注意:content的返回表明了获取是否成功,有的网页是无法获取的!!!返回值一直未空!!
var x = content.getElementsByTagName("tagname")[i].getElementsByClassName("class_name")[i]
功能:进一步查找需要的标签,函数可以叠加,一步步增加条件锁定目标标签。
注意:当content.get写到这时如果有提示选项,则也能表明content获取成功。
var a = x.innerText
var b = x.innerHTML
功能:innerText返回标签中的字符串
innerHTML返回整个标签