Python爬取网页:爬取的网页为http://www.tedu.cn 保存的文件名为/tmp/tedu.html

15 篇文章 0 订阅
2 篇文章 0 订阅

4.1 问题
编写一个get_web.py脚本,实现以下功能:

爬取的网页为http://www.tedu.cn
保存的文件名为/tmp/tedu.html
4.2 方案
导入sys模块,用sys.argv方法获取get_web函数实参,让用户在命令行上提供http://www.tedu.cn和/tmp/tedu.html两个参数,调用get_web函数实现如下功能:

1)导入urllib模块,使用urllib模块的urlopen函数打开url(即网址),赋值给html

2)以写方式打开/tmp/tedu.html文件

3)以循环方式:

读html获取的数据,保存到data

将data写入/tmp/tedu.html

4)关闭html

4.3 步骤
实现此案例需要按照如下步骤进行。

步骤一:编写脚本

[root@localhost day11]# vim get_web.py
#!/usr/bin/env python3
import sys
from urllib.request import urlopen
def get_web(url, fname):
    html = urlopen(url)    #使用urllib模块的urlopen函数打开url,赋值给html
    with open(fname, 'wb') as fobj:
        while True:
            data = html.read(4096)
            if not data:
                break
            fobj.write(data)
    html.close()
if __name__ == '__main__':
    get_web(sys.argv[1], sys.argv[2])        #让用户在命令行上提供网址和下载数据保存位置

步骤二:测试脚本执行

[root@localhost day11]# python3 get_web.py http://www.tedu.cn /tmp/tedu.html
[root@localhost day11]# cat /tmp/tedu.html
执行cat命令可以看到/tmp/tedu.html文件中爬取到的内容
当你遇到 "Cannot resolve cn.tedu:spring-boot-jdbc-starter:1.0-SNAPSHOT" 这样的错误时,通常是在Maven或Gradle项目中找不到指定的Spring Boot JDBC Starter库版本。这可能是由于以下几个原因: 1. **依赖未添加**:确保你在pom.xml(Maven)或build.gradle(Gradle)文件中已经正确添加了这个starter的依赖项。例如,在Maven中: ```xml <dependency> <groupId>cn.tedu</groupId> <artifactId>spring-boot-jdbc-starter</artifactId> <version>1.0-SNAPSHOT</version> </dependency> ``` 如果还没有添加,你需要从仓库(如GitHub、Jcenter等)获取对应的坐标并添加。 2. **版本冲突或缺失**:检查是否有其他依赖对同一个版本进行了声明,导致版本冲突。如果有,尝试更新或锁定依赖版本。 3. **本地仓库问题**:清理本地Maven或Gradle缓存,然后重新同步依赖,命令分别是: - Maven: `mvn clean install` 或者 `mvn dependency:purge-local-repository` - Gradle: `gradle clean` 然后 `./gradlew dependencies sync` 4. **官方库不存在或已废弃**:确认提供的cn.tedu项目的仓库地址是否有效,以及该版本是否已经被维护者废弃。 5. **网络问题**:如果你正在远程仓库下载依赖,可能是网络问题导致无法连接。试着更换网络环境再试一次。 如果以上步骤都无法解决问题,你可以在Stack Overflow、GitHub Issues或其他开发者社区寻找类似问题的答案,或者直接联系项目作者寻求帮助。记得提供详细的错误日志信息以便定位问题。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

彭淦淦

是你的双手成就了我的生活!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值