phantomjs linux 截图,使用phantomjs获取网站快照图和缩略图

找了几个获取网站快照和缩略图的方法,最后决定使用phantomjs。Phantom JS是一个服务器端的 JavaScript API 的 WebKit。其支持各种Web标准: DOM 处理, CSS 选择器, JSON, Canvas, 和 SVG。他可以被应用到web测试,页面访问自动化,屏幕捕获和网络监控等。

安装

官网:http://phantomjs.org/

下载地址:https://bitbucket.org/ariya/phantomjs/downloads/

现在最新版是2.0,不过linux系统没有build。自己build出问题的记录比较大。我选择的是1.9.8这个版本。

# wget https://bitbucket.org/ariya/phantomjs/downloads/phantomjs-1.9.8-linux-x86_64.tar.bz2

# tar jxvf phantomjs-1.9.8-linux-x86_64.tar.bz2

# cd cd phantomjs-1.9.8-linux-x86_64

# cp bin/phantomjs /usr/bin

解压缩后里面有多个example,具体用法详见官方文档。

调用

phantomjs的使用需要调用js,example中也是一些js例子。屏幕截图的js如下,参考。

/*

* desc: get snapshot from url

* author: 十年后的卢哥哥(http://www.cnblogs.com/lurenjiashuo/)

* example: phantomjs snap.js http://www.baidu.com baidu.png

*/

var page = require('webpage').create();

var args = require('system').args;

var pageW = 1024;

var pageH = 768;

page.viewportSize = {

width: pageW,

height: pageH

};

var url = args[1];

var filename = args[2];

page.open(url, function (status) {

if (status !== 'success') {

console.log('Unable to load ' + url + ' !');

phantom.exit();

} else {

window.setTimeout(function () {

page.clipRect = { left: 0, top: 0, width: pageW, height: pageH };

page.render(filename);

console.log('finish:', filename);

phantom.exit();

}, 1000);

}

});

默认脚本中使用1024*768分辨率打开。

用法

phantomjs的最简单用法。

# phantomjs snap.js https://zhangnq.com blog.nbhao.org.jpg

如果碰到截取中文页面的网站出现乱码或者方框,安装下面语言包解决。

# yum install bitmap-fonts bitmap-fonts-cjk

或者

# sudo apt-get install xfonts-wqy

缩略图

安装ImageMagick。

# yum install ImageMagick ImageMagick-devel

用法

# convert -resize 320x240 blog.nbhao.org.jpg blog.nbhao.org_thumbnail.jpg

使用这个方法获取网站缩略图的效果可以参考页面:http://www.hostunion.net/webdir/

参考连接:http://www.cnblogs.com/lurenjiashuo/p/get-snapshot-and-create-thumbnail.html

需要的添加的jar包及工具:我这里使用maven来构建项目,添加依赖如下:   org.seleniumhq.selenium   selenium-java   3.2.0    PhantomJs工具到官网去下载:http://phantomjs.org/download.html 尽量都使用最新版本,不然会出现版本兼容的情况。 这里有一个已经写好的获取PhantomJSDriver的工具类 public static WebDriver getPhantomJs() {   String osname = System.getProperties().getProperty("os.name");   if (osname.equals("Linux")) {//判断系统的环境win or Linux     System.setProperty("phantomjs.binary.path", "/usr/bin/phantomjs");   } else {     System.setProperty("phantomjs.binary.path", "./phantomjs/win/phantomjs.exe");//设置PhantomJs访问路径   }   DesiredCapabilities desiredCapabilities = DesiredCapabilities.phantomjs();   //设置参数   desiredCapabilities.setCapability("phantomjs.page.settings.userAgent", "Mozilla/5.0 (Windows NT 6.3; Win64; x64; rv:50.0) Gecko/20100101 Firefox/50.0");   desiredCapabilities.setCapability("phantomjs.page.customHeaders.User-Agent", "Mozilla/5.0 (Windows NT 6.3; Win64; x64; rv:50.0) Gecko/20100101   Firefox/50.0");   if (Constant.isProxy) {//是否使用代理     org.openqa.selenium.Proxy proxy = new org.openqa.selenium.Proxy();     proxy.setProxyType(org.openqa.selenium.Proxy.ProxyType.MANUAL);     proxy.setAutodetect(false);     String proxyStr = "";     do {       proxyStr = ProxyUtil.getProxy();//自定义函数,返回代理ip及端口     } while (proxyStr.length() == 0);     proxy.setHttpProxy(proxyStr);     desiredCapabilities.setCapability(CapabilityType.PROXY, proxy);   }   return new PhantomJSDriver(desiredCapabilities); } 获取方式     try{     WebDriver webDriver = PhantomJsUtil.getPhantomJs();     webDriver.get(url);     SleepUtil.sleep(Constant.SEC_5);     PhantomJsUtil.screenshot(webDriver);     WebDriverWait wait = new WebDriverWait(webDriver, 10);     wait.until(ExpectedConditions.presenceOfElementLocated(By.id(inputId)));//开始打开网页,等待输入元素出现     Document document = Jsoup.parse(webDriver.getPageSource());     //TODO  剩下页面的获取就按照Jsoup获取方式来做   }finally{     if (webDriver != null) {       webDriver.quit();     }   } python版使用webdriver+PhantomJs爬虫使用,参考http://www.cnblogs.com/kuqs/p/6395284.html
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值