用JAVA编写浏览器内核之实现javascript的document对象与内置方法

2 篇文章 0 订阅
2 篇文章 0 订阅

原创文章,转载请注明。

阅读本文之前,您需要对浏览器如何加载javascript有一定了解。当然,对java与javascript本身也需要了解。

本文首先介绍浏览器加载并运行javascript的原理。

其次将介绍如何用java与javascript互调用对象。

最后介绍如何用java实现javascript的document对象与其它内置方法。

浏览器从服务器得到含有javascript代码的html文本后,将顺序执行javascript代码块。

看代码是最简单的方式:

 



import java.io.IOException;
import java.net.MalformedURLException;
import java.net.URL;

import javax.script.Invocable;
import javax.script.ScriptEngine;
import javax.script.ScriptEngineManager;
import javax.script.ScriptException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class TaoDocument {
	
 Document mydoc = null;
	public TaoDocument(String url) throws MalformedURLException, IOException{
		mydoc = Jsoup.parse(new URL(url),30000);//利用Jsoup实现document树
	}
	
    public Element getElementById(String id){//实现document的getElementById方法
    	System.out.println("Java println:\t"+mydoc.getElementById(id));
    	return mydoc.getElementById(id);//返回的是Element对象
    }
	public static void main(String[] args) throws MalformedURLException, IOException {
		
		
	    ScriptEngineManager sem = new ScriptEngineManager();
	    ScriptEngine se = sem.getEngineByName("javascript"); //初始化Java内置的javascript引擎
	    try {
	    	
	    	 se.eval("function test() {"
	    		    + "id='areaDefault'; print('js print:'+document.getElementById(id));return document.getElementById(id);}"); 
                 //测试用javascript自定义函数,功能为输出id为areaDefault的元素,并返回。
	    	 Invocable invocableEngine = (Invocable) se;//转换引擎类型为Invocable 
	    	 se.put("document", new TaoDocument("http://www.ifeng.com/")); //关联对象,这一步很重要,关联javascript的document对象为TaoDocument,亦即我自己实现的document对象
	    	 Element callbackvalue=(Element) invocableEngine.invokeFunction("test"); //直接运行函数,返回值为Element
	    	 System.out.println("callback return :"+callbackvalue); //打印输出返回内容
	    	 se.eval("test()");//另外一种调用函数方式,我更偏爱此种方式
		} catch (ScriptException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} catch (NoSuchMethodException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} 

	}

}


通过实现document对象,就可以动态解析html页面了。

 

在另外的文章,我将介绍如何结合httpclient,使其成为headless浏览器的雏形。

 

  • 4
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值