其实就是一个html和一个js文件便可以轻松抓取。
以抓取图片为例子。
html文件:
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Title</title>
<script src="photo.js">
</script>
</head>
<body>
<script>
var urlArr = s.match(/https?:\/\/[^:]+\.(jpg|jpeg|png|gif)/gi);
for(var url of urlArr){
var img = document.createElement("img");
img.src = url;
document.body.appendChild(img);
}
</script>
</body>
</html>
在html文件中有一个photo.js文件。js文件怎么写呢?
var s="@@@@";
就一行代码,其中@@@@就是你去你要截取的网站的页面代码。
比如你要去千库网的首页所有照片的抓取,你就进入千库网首页,点击右键查看源代码,全选,进行拷贝到@@@@这个地方就行了。(不要@@@@,@@@@是用你复制的原代码替换的。)
这样就可以抓取了。