- 博客(5)
- 资源 (2)
- 收藏
- 关注
原创 JS页面滚动
前言JavaScript技术大发展的今天,越来越多的网页都深入使用了JavaScript技术。在做爬虫的时候,请求的页面不一定是最终的看到的效果,可能需要再浏览器中执行一些脚本才能出现我们最终看到的页面。静态爬虫就无法爬取动态生成的页面。Phantomjs是一个无界面的浏览器,可以模拟浏览器去访问,如果需要执行脚本,也有相应的接口。Selenium 是目前用的最广泛的Web UI 自动化测
2018-01-09 10:48:22 6739 1
转载 XML——xmlns、xmlns:xsi和xsi:schemaLocation
转载:https://my.oschina.net/itblog/blog/390001?spm=5176.100239.blogcont40353.8.774163cb2NH7dT相信很多人和我一样,在编写Spring或者Maven或者其他需要用到XML文档的程序时,通常都是将这些XML文档头拷贝过来,并没有理解其中元素(比如xmlns,xmlns:xsi,xsi:schemaLocat
2018-01-07 17:45:12 368
原创 URL详解
URL的组成://:@:/;?# scheme协议,列举几个最常见的协议 - http 超文本传输协议 - https 安全的http协议,在应用层和传输层中间加了SSL层 - ftp 文件传输协议 - mailto 发送email - file 访问本地文件user:password网站设置权限的时候,访问时需要用户名和密码,似乎用的也不多host:porthos
2018-01-07 16:53:46 184
原创 JavaScript获取XPath元素
使用JavaScript获取XPath对应的元素时,分为以下几步获取浏览器的XML解析对象(var xmlhttp=new XMLHttpRequest())使用解析对象解析XML文档,返回解析后的文档对象(xmlDoc=xhttp.responseXML)调用内置函数解析XPath表达式,返回解析结果(xmlDoc.evaluate(xpath, xmlDoc, null, XPath
2018-01-07 14:40:26 4693
原创 HTML/CSS/XML--XPath语法
XPath简介XPath 是一门在 XML 文档中查找信息的语言。XPath包含一个标准函数库;它是XSLT的主要元素。XPath节点关系父,子,同胞,先辈,后代。先辈节点包含父节点,后代节点包含子节点。XPath语法bookstore>book> title lang="eng">Harry Pottertitle> price>29.99price>
2018-01-06 13:38:45 200
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人