爬虫
文章平均质量分 59
泓铭
这个作者很懒,什么都没留下…
展开
-
爬虫最终杀手锏 --- PhantomJS 详解(附案例)
一 . 认识PhantomJS 1. PhantomJS:无界面的浏览器 Selenium: 可以根据我们的指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏,或者判断网站上某些动作是否发生。Selenium 自己不带浏览器,不支持浏览器的功能,它需要与第三方浏览器结合在一起才能使用。但是我们有时候需要让它内嵌在代码中运行,所以我们可以用一个叫 PhantomJS 的工...原创 2018-07-29 13:45:12 · 1107 阅读 · 0 评论 -
爬虫案例 --- Python 爬取淘宝数据存到数据库
可以做爬虫的语言有很多,如 PHP、Java、C/C++、Python等等...1)PHP语言 虽然是世界上最好的语言,但是他天生不是干这个的,而且对多线程、异步支持不够好,并发处理能力很弱。爬虫是工具性程序,对速度和效率要求比较高。2)Java 语言的网络爬虫生态圈也很完善,是Python爬虫最大的对手。但是Java语言本身很笨重,代码量很大。 重构成本比较高,任何修改都会导致...原创 2018-07-27 11:37:43 · 5609 阅读 · 1 评论