代码打开/保存文件练习

文章展示了在Python中读取文本文件的两种常见方法:一是使用`open()`函数,指定文件路径、模式(rb)和编码(utf-8),然后通过循环遍历文件内容;二是使用`withopen()`的上下文管理器,同样指定路径、模式和编码,简化了文件关闭的操作。这两种方法都用于处理文本文件。
摘要由CSDN通过智能技术生成
#方法一:
file=open('..\Stu_pack\file\万疆.txt','rb',encoding='utf-8')

for line in f:
    print(line)
    
f.close()
方法二:
with open(r'C:\Users\Administrator\Desktop\2111405沈恒隆\Stu_pack\file\See You Again.txt')
    for line in f:
        print(line)

要用Python爬取网页“https://www.kaoshibao.com/sctk/”上的在线练习题库并保存成"题库.txt",你可以按照以下步骤进行: 1. 首先,你需要安装`requests`和`BeautifulSoup`库(如果你还没有安装的话),这两个库可以帮助你发送HTTP请求和解析HTML内容。你可以使用pip命令进行安装: ``` pip install requests beautifulsoup4 ``` 2. 接下来,编写Python脚本来爬取网页数据。使用`requests`库发送HTTP请求获取网页内容,然后使用`BeautifulSoup`解析HTML文档。 3. 找到包含题库内容的HTML元素,并提取出你需要的题目信息。 4. 将提取出的信息保存到文本文件中。 下面是一个简单的代码示例,用于说明如何实现这个过程: ```python import requests from bs4 import BeautifulSoup # 目标URL url = 'https://www.kaoshibao.com/sctk/' # 发送GET请求 response = requests.get(url) # 检查请求是否成功 if response.status_code == 200: # 解析HTML内容 soup = BeautifulSoup(response.text, 'html.parser') # 假设题目都在某个特定的HTML元素中,比如class为"question"的div中 # 这里需要根据实际网页结构进行调整 questions = soup.find_all('div', class_='question') # 打开文件准备写入 with open('题库.txt', 'w', encoding='utf-8') as file: for question in questions: # 提取题目文本,这里也需要根据实际网页结构进行调整 question_text = question.get_text().strip() # 写入文件 file.write(question_text + '\n\n') else: print('请求失败,状态码:', response.status_code) ``` 请注意,以上代码是一个简单的示例,实际上网页的结构可能更加复杂,题目可能分布在不同的HTML元素或类名中。你需要根据实际的网页结构来调整选择器。另外,如果网站有反爬虫措施,可能需要额外处理如设置请求头、处理Cookies、使用代理等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值