php 向html追加元素,在PHP中存储兄弟元素的属性和内部HTML

我试图从HTML页面中搜索和存储值,所以我有一个简单的数组数组。它只有2个数组,每个数组有3个项目长。我是这样定义的;这些只是标题:

$fileContents = array(

array('Date', 'Title', 'Link')

);

HTML具有以下结构:

06/08/2018

My Title

这个结构重复几次。我只需要上面的第一个(最新的)。我可以看到我需要的所有信息或者我的数组都在那里。

Date

06/08/2018

,请

Title

My Title

,和

Link

www.example.com/

.但我不知道如何访问它们,尤其是标题和链接,因为这些元素上没有类。为了进一步澄清,我希望这是一个最终结果(它是一个csv):

Date, Title, Link

06/08/2018, My Title, https://www.example.com/

目前我正在使用以下方法。我唯一知道的是日期:

$dateClassName="my-date";

$xpath = new DomXpath($doc);

$dateList = $xpath->query("//span[contains(@class, '$dateClassName')]");

$dateNode = $dateList->item(0);

function innerHTML($node) {

return implode(array_map([$node->ownerDocument, "saveHTML"],

iterator_to_array($node->childNodes)));

}

$textArray = array();

array_push($textArray, innerHTML($dateNode));

剩下的项目(链接和标题)我不知道如何存储,因为元素上没有类。

问题:

考虑到我上面现有的方法,如果有问题的元素没有公开的类来搜索,我还能做些什么来存储HTML中需要的值呢?我能凭借他们的兄弟姐妹地位得到他们吗?

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值