要比较Information Extraction的效率,把网页保存在本地这样可以排除网速的影响,从而得到一个更让人信服的结果,但是直接的download许多动态网页,保存下来的结果在浏览器呈现就会失去原来的样式,从而影响Extraction的准确性特别是利用Visual信息的Extraction算法,另一方面许多测试的网页过一段时间可能就不存在了,一个可以Save网页完整信息的工具就显得比较重要,这个工具就是提供这个功能的。
一个很有用的Information Extraction的firefox插件
最新推荐文章于 2024-07-24 15:50:22 发布