2015年05月_kezhen

07月 05月 04月 03月 02月 01月

转载爬虫采集-基于webkit核心的客户端Ghost.py [爬虫实例]

转自：http://rfyiamcool.blog.51cto.com/1030776/1287810对与要时不时要抓取页面的我们来说，是痛苦的~由于目前的Web开发中AJAX、Javascript、CSS的大量使用，一些网站上的重要数据是由Ajax或Javascript动态生成的，并不能直接通过解析html页面内容就能获得（例如采用urllib2，mechanize、lxml

2015-05-25 15:31:39 2115

转载 ConfigParser – Work with configuration files

引自：http://pymotw.com/2/ConfigParser/Use the ConfigParser module to manage user-editable configuration files for an application. The configuration files are organized into sections, and each se

2015-05-14 14:33:00 536

转载 CentOS Linux上的phantomjs安装教程

转自：http://www.oicqzone.com/pc/2014092319826.htmlsudo apt-get update sudo apt-get install build-essential chrpath git-core libssl-dev libfontconfig1-dev libxft-dev git clone git://github.co

2015-05-11 16:31:30 6957

转载使用Selenium和PhantomJS解析带JS的网页

转自：http://smilejay.com/2013/12/try-phantomjs-with-selenium/有的网页，不能直接通过wget/curl等命令、或者直接使用Python中的liburl这样的函数库来直接获取其真正展现给用户的信息，因为里面包含有JavaScript脚本（而该JS和页面数据的生成相关），需要通过Firefox、Chrome等浏览器渲染后才能得到想要看

2015-05-06 15:32:50 2519

转载 Web Scraping Ajax and Javascript Sites

转自：http://blog.databigbang.com/web-scraping-ajax-and-javascript-sites/IntroductionMost crawling frameworks used for scraping cannot be used for Javascript or Ajax. Their scope is limited t

2015-05-06 10:09:45 1098

转载 Scrapy: Run Using TOR and Multiple Agents

转自：http://pkmishra.github.io/blog/2013/03/18/how-to-run-scrapy-with-TOR-and-multiple-browser-agents-part-1-mac/Scrapy is a brilliant and well documented crawler written in python. Though it is n

2015-05-04 16:38:05 878

驱动开发资料

WIN2000操作系统是计算机历史上最安全的操作系统，本节介绍WIN2000系统中驱动程序设计者最关心和最感兴趣的部分。 WIN2000的设计目标　　有趣的是，原始的NT("New Technology")概念中不包含操作系统环境，直到1989年第一个NT操作系统出现了很长时间后。但是它还保持着原始的设计目标: 兼容性:　尽可能的支持现有的软件和硬件。稳定性和可靠性:　操作系统不会因为用户的误操作而损坏，一个用户程序应该不会使操作系统崩溃。可移植性:　操作系统应当可在尽可能多的当前和未来的平台上运行。可扩展性:　随着时间的流逝，市场的改变，操作系统应当可以只用添加少的代码就可以支持新的硬件和添加新的功能。性能:　操作系统应当尽可能大的发挥硬件的效能。当然，随着时间的流逝，操作系统的设计目标也是改变的，剩下的部分介绍怎样在设计中实现这些目标。

2012-07-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

转载 爬虫采集-基于webkit核心的客户端Ghost.py [爬虫实例]