本文引用至: web worker
由于浏览器的限制,注定了每个网页只能在一个进程程当中运行, 而且,js又只能运行在一个线程当中. 所以, 作为一名开发者来说, 对于这样的结果就只能呵呵了. 如果你想进行高复杂度的运算, 基本上就可以go die了(只要运行, 你网页基本上就崩掉了). 当然,聪明的W3C早就知道developer心里的小猫腻. 推出了web worker 这个概念. 我们接下来,来正式接触一下 web worker吧.
初入web worker
web worker 既然是一个线程. 那必定会设计到线程间的通信. 这里,ww(web worker)提供了一个最简单的方法--postMessage(msg) 进行双向通信.
来看一个简单的Demo:
// index.html 中的 main.js
var worker = new Worker('Worker.js');
worker.addEventListener('message', function(e) {
console.log('Worker said: ', e.data);
}, false);
worker.postMessage('Hello World'); // Send data to our
// Worker.js内容
self.addEventListener('message', function(e) {
self.postMessage(e.data);
}, false);
当载入main.js时, 在Console里,就会出现Hello World
的内容. 上面的例子实际上,已经说明了worker的工作原理. 在worker中,self就是 new Wroker的实例化的内容.
不过, 这里想强调一点, 通过postMessage传递的msg并不是两个线程共享的.(要是共享的,不就GG了) 传递的Msg实际上是一个副本, 最具有代表性的,应该就算是Object.
// main.js 传递一个Object
var worker = new Worker('Worker.js');
worker.addEventListener('message', function(e) {
console.log('Worker said: ', msg.a);
}, false);
var msg = {
a:2
}
worker.postMessage(msg);
// worker.js 接受,并返回
self.addEventListener('message', function(e) {
e.data.a=3;
self.postMessage(e.data);
}, false);
// 最后返回的结果是2
在一端向另外一端传递msg时, 中间会经过serialized, 然后de-serialized 最终得到结果. 通俗一点就是:
// 传递前
JSON.stringify(msg);
// 解析数据
JSON.parse(msg);
当worker已经处理完毕,没有多大卵用之后. 就可以kill掉该线程.
关闭worker
在web中, 提供了两种方法来关闭Web Worker. 关闭指定的Worker之后, 相当于即,kill 掉该线程. 所以, 这里需要注意一下:
worker.terminate(): 在外部终结该worker.
self.close(): 在worker内部自动终结.
官方推荐是,使用self.close进行内部的自动关闭. 这样能防止, 意外关闭正在运行的worker.
worker作用域
上面,在worker.js中,我们使用self来获取worker自带的方法.
self.addEventListener('message', function(e) {
self.postMessage(e.data);
}, false);
实际上, 在worker中, 他的全局索引就是self和this. 所以, 上面的代码可以简写为:
addEventListener('message', function(e) {
postMessage(e.data);
}, false);
worker 可访问的 feature
worker 引用的就是js文件, 可能有些童鞋就会将worker当成一般js来使用. 但是,由于worker是独立的线程原因,他和main js threading还是有很大区别的.
他能够访问的权限有:
The navigator object: window.navigator 相关属性和方法
The location object (read-only): 只读的window.location内容.
XMLHttpRequest: 卧槽... 可以访问这个那就不得了了. worker就可以利用ajax来和后台进行通信了.
setInterval()相关时间函数
剩下的就是不能访问的了。
错误处理
web worker 中的error handler和window处理的方式,也是使用error时间进行监听.
worker.onerror = function(e){
throw new Error(e.message + " (" + e.filename + ":" + e.lineno + ")");
};
同域限制
worker在访问时, 只能是在同一host下才行. 即, 你的worker只能处于指定目录下的path中。
// 这种情况下,就无法访问worker
new Worker('http://crossdomain.com/worker.js');
另外, 如果你使用的是本地调试file://xxx
的话, 也不能使用worker.
subworkers
在一个worker里面可以再spawn出其他的worker. 使用方法和在main.js中一样.
// 加载worker.js
var sub_worker = new Worker('subworker.js');
subworker和worker有这同样的限制, 同域, 并且他的路由是相对于parent worker. 来看一个demo吧:
// main.js
var worker = new Worker('worker.js');
worker.onmessage = function (event) {
document.getElementById('result').textContent = event.data;
};
// worker.js
// 用来进行遍历计算
var num_workers = 10;
var items_per_worker = 1000000;
// start the workers
var result = 0;
var pending_workers = num_workers;
for (var i = 0; i < num_workers; i += 1) {
var worker = new Worker('subworker.js');
worker.postMessage(i * items_per_worker);
worker.postMessage((i+1) * items_per_worker);
worker.onmessage = storeResult;
}
// handle the results
function storeResult(event) {
result += 1*event.data;
pending_workers -= 1;
if (pending_workers <= 0)
postMessage(result); // finished!
}
// subworker.js
var start;
onmessage = getStart;
function getStart(event) {
start = 1*event.data;
onmessage = getEnd;
}
var end;
function getEnd(event) {
end = 1*event.data;
onmessage = null;
work();
}
function work() {
var result = 0;
for (var i = start; i < end; i += 1) {
// perform some complex calculation here
result += 1;
}
postMessage(result);
close();
}
另外,如果你想在当前的worker里面加载其他库文件, 就可以使用importScripts
来导入.
// 导入其他库的文件
importScripts('jquery.js','react.js','react-dom.js');
worker的用处
根据worker 独立线程这一特性. 他的使用场景也非常清晰了.反正什么大规模数据并发,I/O操作的.都可以交给他来进行. 总的来说有一下几种场景:
懒加载数据
文本分析
流媒体数据处理
web database的更新
大量JSON返回数据的处理
shared worker
除了大家所熟知的web worker, 或者更确切的来说--Dedicated workers.
总的来说web worker分为两种:
Dedicated worker (DW): 即使用 new Worker()来创建的. 该worker一般只能和creator进行通信. 即, 在创建worker的js script中才能使用.
Shared Wrokers (SW): 使用new SharedWorker() 进行创建. 他能在不同的js script中使用.
具体来讲SW和DW的区别就是一个只能在一个script中使用. 一个可以在不同的script中使用.
看一个简单demo:
// index.html 发起shared worker 通信
<script>
var worker = new SharedWorker('sharedWorker.js');
worker.port.addEventListener("message", function(e) { console.log(e.data);
}, false);
worker.port.start();
// post a message to the shared web worker
console.log("Calling the worker from script 1");
worker.port.postMessage("script-1");
</script>
<script>
console.log("Calling the worker from script 2");
worker.port.postMessage("script-2");
</script>
// sharedWorker.js 内
var connections = 0;
self.addEventListener("connect", function (e) {
var port = e.ports[0];
connections++;
port.addEventListener("message", function (e) {
port.postMessage("Welcome to " + e.data +
" (On port #" + connections + ")");
}, false);
port.start();
}, false);
不过, SW的兼容性比较差, 能真正在实践场景使用的地方还是少的. 所以,这里也只是当做了解.
SW 和 DW 一样, 也有一些features:
映入外部文件: importScripts()
错误监听: error事件监听
关闭通信: port.close()
ajax交互: 有权访问xmlHttpRequest对象
能访问navigator object
访问 location object
setTimeout等时间函数