爬取
彭淦淦
破烂猴
展开
-
Python爬取网页:爬取的网页为http://www.tedu.cn 保存的文件名为/tmp/tedu.html
4.1 问题 编写一个get_web.py脚本,实现以下功能: 爬取的网页为http://www.tedu.cn 保存的文件名为/tmp/tedu.html 4.2 方案 导入sys模块,用sys.argv方法获取get_web函数实参,让用户在命令行上提供http://www.tedu.cn和/tmp/tedu.html两个参数,调用get_web函数实现如下功能: 1)导入urllib模块,使用urllib模块的urlopen函数打开url(即网址),赋值给html 2)以写方式打开/tmp/tedu.原创 2020-05-30 16:37:21 · 495 阅读 · 1 评论 -
Python爬取图片
5.1 问题 将http://www.tedu.cn所有的图片下载到本地 本地的目录为/tmp/images 图片名与网站上图片名保持一致 5.2 步骤 实现此案例需要按照如下步骤进行。 步骤一:编写脚本 1)爬取网页内容放入指定fname(即/tmp/tedu.html)文件中 创建get_web.py文件,编写代码如下: [root@localhost day11]# vim get_web.py #!/usr/bin/env python3 import sys from urllib.reques原创 2020-05-30 16:39:09 · 422 阅读 · 0 评论