- 博客(3)
- 收藏
- 关注
原创 使用python抓取js动态加载的网页
我们在做网页抓取的时候,一般来说使用urllib和urllib2就能满足大部分需求。但是有时候我们遇见那种使用js动态加载的网页。就会发现urllib只能抓出一个部分内容空白的网页。解决办法是使用selenium+phantomjs进行抓取。。。审查元素之后,。发现百度图片中,显示图片的div为:pullimages这个div里面的内容是动态加载的。而使用urllib&urllib2
2015-10-19 11:49:11 21473
转载 linux下操作zip文件命令大全
linux下经常需要对压缩文件进行操作,以下是操作zip文件解压的命令:命令名 : unzip语法:unzip [-cflptuvz][-agCjLMnoqsVX][-P ][.zip文 件][文件][-d ][-x ] 或 unzip [-Z]补充说明:unzip为.zip压缩文件的解压缩程序。参数:-c 将 解压缩的结果显示到屏幕上,并对字符做适当的转换
2015-10-09 11:21:25 1206
原创 selenium使用send_keys()方法写中文报错的解决方法
在使用selenium时候,难免会遇到需要处理中文的情况。毕竟咱们是在中国,做的产品大都也是和中文有强烈联系的。举例:打开好搜。搜索“灵魂摆渡”,找到类名为:‘g-mohe ’的类。然后退出。代码如下:driver = webdriver.Chrome()driver.maximize_window()driver.get("http://www.haosou.com"
2015-10-08 15:02:32 28189
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人