浏览器
Jeruen
这个作者很懒,什么都没留下…
展开
-
用JAVA编写浏览器内核之实现javascript的document对象与内置方法
原创文章,转载请注明。阅读本文之前,您需要对浏览器如何加载javascript有一定了解。当然,对java与javascript本身也需要了解。本文首先介绍浏览器加载并运行javascript的原理。其次将介绍如何用java与javascript互调用对象。最后介绍如何用java实现javascript的document对象与其它内置方法。浏览器从服务器得到含有javascri原创 2016-03-17 11:56:23 · 29322 阅读 · 3 评论 -
用juniversalchardet解决爬虫乱码问题
原创文章,转载请注明。 爬虫往往会遇到乱码问题。最简单的方法是根据http的响应信息来获取编码信息。但如果对方网站的响应信息不包含编码信息或编码信息错误,那么爬虫取下来的信息就很可能是乱码。 好的解决办法是直接根据页面内容来自动判断页面的编码。如Mozilla公司的firefox使用的universalchardet编码自动检测工具。 ju原创 2016-03-25 12:44:02 · 19448 阅读 · 0 评论