html如何循环保存数据,如何在Python中循环遍历html-table-dataset

博主正在从PHP转向Python,并面临理解常见设计模式的挑战。他们正在使用BeautifulSoup进行网页抓取,目标是处理具有日期、标题和链接结构的数据。问题在于如何同时跟踪日期并遍历相关项目,以及如何存储处理后的数据到数组中,最终将数据插入数据库。博主寻求解决方案以及解决此类问题的逻辑和策略。
摘要由CSDN通过智能技术生成

我是第一次在这里试图获取一些Python技能的海报; 请善待我:-)

虽然我不是编程概念的完全陌生人(我以前一直在乱用PHP),但过渡到Python对我来说有点困难.我想这主要与我缺乏大多数 - 如果不是全部 - 基本理解常见的"设计模式"(?)等事实有关.

话虽如此,这就是问题所在.我目前的项目的一部分涉及利用Beautiful Soup编写一个简单的刮刀.要处理的数据具有与下面列出的数据有些类似的结构.

2011-01-01
Headline
Headline
2011-01-02
Headline
Headline

主要问题是我无法理解如何1)跟踪当前日期(tr-> td class ="date"),同时2)循环后续tr:s中的项目(tr class ="item" - > td class ="headline"和tr class ="item" - > td class ="link")和3)将处理后的数据存储在数组中.

此外,所有数据都将插入到数据库中,其中每个条目必须包含以下信息;

日期

标题

链接

请注意,crud:数据库不是问题的一部分,我只是提到这一点,以便更好地说明我在这里要完成的事情:-)

现在,有许多不同的方法可以给猫皮肤.因此,尽管手头问题的解决方案确实非常受欢迎,但如果有人愿意详细阐述您为了"攻击"这类问题而使用的实际逻辑和策略,我将非常感激:-)

最后但同样重要的是,对于这样一个无聊的问题感到抱歉.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值