phantomJS区域截图及保存文本的简单例子

phantomJS区域截图只需要指定截图的上,左的起始位置,以及截图的宽高即可。

文本的处理,只需要在page.evaluate()函数中,通过dom选择器,选择到需要输出的文字内容即可,同时也可以写入本地文件中。

以csdn博客首页为例,来进行一个简单的截图和文本提取,比如需要首页的第一篇博客的截图和标题,代码如下:

var page = require('webpage').create();
var fs = require('fs');
//要打印的url地址
var address = 'http://blog.csdn.net/';
//存储文件路径和名称
var outputPng = './csdn/img.png';
var outputTxt = './csdn/data.txt'
//设置长宽
page.viewportSize = { width: 1280, height: 800 };

page.open(address, function(status) {
	if(status !== 'success') {
		console.log('Unable to load the address!');
		phantom.exit();
	} else {

		//截图的偏移和宽高
		page.clipRect = {
			top: 186,
			left: 101,
			width: 855,
			height: 207
		};

		text = page.evaluate(function() {
			var title = document.getElementsByClassName('blog_list_wrap'
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值