开发网络爬虫的语言很多
Python java PHP
八爪鱼采集器
http://www.gooseeker.com/pro/product_mac.html
metaseeker
==================
urlretrieve执行的过程中 会产生一些缓存 我们想清除这些缓存信息 可以用urlcleanup()
--------getcode()
---------
破坏性的 创新能力的人
---------
这些网页为了防止别人恶意 采集其信息所以进行了一些反爬虫的设置。
可以设置一些Headers信息 模拟成浏览器去访问这些网站 就能够解决这个问题
--------
立足于这个阶级 然后开始发展
--------破坏的创新力
----------