第四次作业:用python简单爬取合法新闻网页并将其储存在本地文件中。

 

目标网页 

 实现代码

记事本结果 

import requests
from bs4 import BeautifulSoup
try:
    wz='https://www.news.cn/science/20241220/5557bb1181174c93ba0190ed84bde028/c.html'
    v=requests.get(wz)
    v.raise_for_status()
except requests.RequestException as e:
    print(f'请求失败:{e}')
    exit()
n=BeautifulSoup(v.text,'html.parser')
a=[]
for paragraph in n.find_all('p'):
    a.append(paragraph.getText(strip=True))
with open('paxinwen.txt','w',encoding='utf-8') as pa:
    for line in a:
        pa.write(line+'\n')
print("新闻内容已保存到paxinwen文件中")

 代码内容

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值