最近想找一个英语音标数据库,但是一直没有找到满意的,于是想到自己做个网络爬虫爬取有道词典的英语音标。
由于自己比较喜欢用javascript写代码,虽听说用python也可以写爬虫,但是我很不习惯哪种没有;{}边界符号的代码,因为难以阅读,不便于调试和维护,所以找到了nw.js这个基于node.js的工具,其实用node.js就可以写爬虫了,但是想更加直观点,将结果反馈输出到图形界面上。
爬虫程序编写过程中遇到的第一大难题就是node的异步问题,传统的javascript程序是同步的,程序代码也是顺序执行的,但是node的代码是基于事件异步执行,所以理解这个费了我大半天时间,到现在也仍然存在许多不理解,好在是程序顺利跑起来了,结果也是正确的。
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<title>Hello World!</title>
<style>
</style>
</head>
<body>
<h3>node.js 获取网页源码并保存到本地文件</h3>
<hr>
node.js 版本<script>document.write(process.version)</script>.
<div id="info"></div>
<div id="info0"></div>
<script>
v