python实现遍历HTML元素,如何循环遍历Python中的html表格数据集

我是第一次在这里尝试获取一些Python技能的海报;请对我友好:-)如何循环遍历Python中的html表格数据集

虽然我对编程概念并不陌生(我之前一直在搞PHP),但对Python的过渡对我来说变得有点困难。我想这主要是因为我缺乏大部分 - 如果不是全部 - 对普通“设计模式”(?)等的基本理解。

说了这么多,就是这个问题。我目前的一部分工作是利用美丽的汤来写一个简单的刮板。要处理的数据与下面列出的数据具有相似的结构。

2011-01-01
Headline
Headline
2011-01-02
Headline
Headline

的主要问题是,我根本不能让我围绕着如何1)保持当前的日期(TR-> TD类=“日期”的轨迹),而2头)循环遍历项目后续的tr:s(tr class =“item” - > td class =“headline”和tr class =“item” - > td class =“link”)以及3)将处理后的数据存储在一个数组中。

此外,所有数据将被插入数据库,其中每个条目必须包含以下信息;

日期

标题

链接

注意污物:荷兰国际集团的数据库不是问题的一部分,我只是为了更好地说明什么,我想提到这个在这里完成:-)

现在,有很多不同的方法来皮肤猫。因此,虽然解决手头问题的方法确实非常受欢迎,但如果有人愿意详细阐述为了“攻击”这类问题而使用的实际逻辑和策略,我将非常感激:-)

最后但并非最不重要的是,对于这样一个不好的问题抱歉。

2011-01-07

Mattias

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值